2. 程序编译的四个阶段

0.引言

hello.c(源程序)是一条高级C语言程序,虽然它是以一种易读的形式,让人们容易理解。但是,它却无法直接驱动硬件CPU直接执行。为了我们编写的hello.c程序可以被执行,驱动硬件电路工作,hello.c程序必须经过一些列处理步骤,将源程序转化为可执行性的目标程序。

而我们知道,机器语言就是处理器可以直接理解(与生俱来就能理解)的编程语言,机器语言有时也被叫做原生代码(Native Code)[1],而机器语言是一种以“0、1、0、1”的表现形式二进制代码,因此源程序的编译过程任务即就是:将以高级语言编写的程序转换为以二进制代码的可执行性目标程序


1.编译过程的四个阶段

源程序到目标程序执行的四个阶段如图1所示,GCC编译C源代码有四个步骤:预处理—->编译—->汇编—->链接。
图1 程序编译的四个阶段

以源程序hello.c为例
#include <stdio.h>

int main()
{
    printf("happy new year!\n");
    return 0;
}

2.预处理阶段(.c—.i)

编译器将C程序的头文件编译进来,还有宏的替换,可以用gcc的参数-E来参看。

命令:unix>gcc –o hello hello.c
作用:将hello.c预处理输出hello.i


3 编译(.i—.s)转换为汇编语言文件

这个阶段编译器主要做词法分析、语法分析、语义分析等,在检查无错误后后,把代码翻译成汇编语言[2]。可用gcc的参数-S来参看。
编译器(ccl)将文本文件hello.i 翻译成文本文件hello.s, 它包含一个汇编语言程序。
一条低级机器语言指令。
命令:gcc -S hello.i -o hello.s
作用:将预处理输出文件hello.i汇编成hello.s文件


4.汇编阶段(.s—.o)得到机器语言

汇编器as 将hello.s 翻译成机器语言保存在hello.o 中(二进制文本形式)。


5.链接阶段

printf函数存在于一个名为printf.o的单独预编译目标文件中。必须得将其并入到hello.o的程序中,链接器就是负责处理这两个的并入,结果得到hello文件,它就是一个可执行的目标文件。

[1] 矢泽久雄胡屹.计算机是怎样跑起来的 : How computers work[M]:人民邮电出版社,2015.
[2] Bryant RandalE.,O’Hallaron DavidR.,布莱恩特等.深入理解计算机系统[M]:机械工业出版社,2011.

猜你喜欢

转载自blog.csdn.net/DylanDong/article/details/60465718