文章目录
前言
在计算机科学的浩瀚宇宙中,编译器是承载着人类思想与机器语言之间的桥梁。而在这个领域中,GCC(GNU Compiler
Collection)无疑是最具传奇色彩的存在之一。作为Linux世界中最为广泛使用的编译器,GCC不仅仅是程序员手中的工具,它更是一把通向计算机奥秘的钥匙,揭示了语言如何变为机器指令,如何将思维转换为计算的力量。
GCC,这个名字曾伴随无数程序员的日日夜夜,成为编程的必备工具。今天,我们将穿越编译的迷雾,走近GCC,探索其背后的编译原理和实际使用,领略这位伟大的“编译大师”的魅力。
一、GCC的起源与发展
GCC,最初由理查德·斯托曼(Richard
Stallman)于1987年发布,最初的目标是为GNU操作系统提供一个自由的编译器。随着时间的推移,GCC逐渐发展成为支持多种编程语言的强大编译器套件,涵盖了C、C++、Fortran、Ada、Objective-C等多种语言。
==GCC不仅支持跨平台的编译,还以其开源性质成为了全球开发者的心头好。==它遵循自由软件的理念,使得无数开发者得以在自由、开放的环境中进行创新与合作。如今,GCC已不仅仅是一个编译器,它更是一个编程工具链的核心,为开源社区的蓬勃发展提供了强大的支撑。
二、GCC的工作原理:从源代码到机器语言的蜕变
要理解GCC的核心,我们必须走进它的内在运作,揭开它如何将高层语言的源代码转化为计算机能够理解的机器指令的神秘面纱。
1. 预处理阶段(Preprocessing)
GCC的编译过程首先从预处理阶段开始。在这一阶段,GCC会对源代码进行初步的处理,主要任务包括:
-
宏替换:所有以 # 开头的预处理指令,如 #define 和 #include,都会被处理。宏定义会被替换成相应的值,头文件也会被插入到代码中。
-
条件编译:根据不同的宏定义,GCC会选择性地编译代码片段,这为跨平台编程提供了便利。
-
预处理后,源代码会生成一个 .i 文件,其中包含了处理过的源代码,准备进入下一步的编译阶段。
2. 编译阶段(Compilation)
在编译阶段,GCC将预处理后的代码转化为汇编代码。此时,GCC会进行词法分析、语法分析和语义分析:
词法分析:将源代码分解成一个个基本的词法单元(Token),比如关键字、标识符、运算符等。
语法分析:通过语法分析器,GCC检查源代码是否符合语言的语法规则,生成语法树。
语义分析:GCC进一步检查代码的逻辑是否正确,例如变量是否已声明,类型是否匹配等。
通过这些复杂的分析,GCC最终生成一个 .s 的汇编文件,该文件包含了能够被汇编器处理的汇编代码。
3. 汇编阶段(Assembly)
在汇编阶段,GCC将汇编代码转换成机器代码。在这个阶段,GCC调用系统的汇编器(如 as),将汇编语言翻译成二进制的机器语言指令,生成一个 .o 的目标文件。
4. 链接阶段(Linking)
链接阶段是编译过程的最后一步,也是最为重要的一步。在这一阶段,GCC将目标文件与库文件进行连接,生成最终的可执行文件。链接器(如 ld)会将目标文件中的符号与外部库的符号进行匹配,解决函数调用和变量引用等问题,最终将多个目标文件合并成一个完整的可执行文件。
如果在编译过程中出现了未定义的符号或其他错误,链接器会报告相应的错误信息,提示开发者进行修正。
三、GCC的使用
3.1 安装GCC
在 Ubuntu 系统中,可以使用以下命令安装 GCC:
sudo apt update
sudo apt install build-essential
build-essential 软件包包含了 GCC 及其相关的工具和库。
3.2 基本语法
GCC 的基本语法如下:
gcc [options] [source files] [object files] [libraries]
3.3 使用方法
gcc编译的基本语法就是上面的那种格式,那么具体该如何使用呢?我们通过一个C语言的代码来试一下
我们创建一个C语言文件hello.c
touch hello.c
利用vim编辑器进行编辑
#include <stdio.h>
int main() {
printf("Hello, World!\n");
return 0;
}
写入之后通过以下命令编译该程序
gcc hello.c -o hello
hello.c就是我们需要编译的文件,-o是gcc的一个选项,作用是将编译后的可执行文件给定一个文件名,hello就是我们所指定的文件名,编译好后的可执行文件就是这个
上面编译得到的hello可执行程序,可以使用以下命令来运行它:
./hello
四、GCC如何完成编译
上面我们讲了gcc如何进行编译,下面我们就来思考一下,gcc是如何处理的,能让hello.c这样一个C语言文件生成一个可执行程序hello的呢?
这就与我们上面讲到的背景知识有关,gcc编译代码的逻辑也是那四步:
下面是对这四步进行详解:
4.1 预处理
在这个阶段,GCC 处理源代码中的预处理指令。预处理器主要完成以下任务:
宏替换:将定义的宏(如 #define)替换为实际的值。
文件包含:处理 #include 指令,将被包含的文件内容插入到源文件中。
条件编译:根据条件指令(如 #ifdef, #ifndef 等)选择性地编译代码。
预处理的结果是一个扩展名为 .i 的中间文件,包含了所有的宏替换和文件包含后的代码。
gcc -E hello.c -o hello.i
选项-E的作用就是让gcc在预处理结束之后停止编译,.i的中间文件就是原本代码进行预处理之后所得到的中间代码
4.2 编译
在这个阶段,GCC 将预处理后的源代码转换为汇编语言。编译器会将每个源文件解析成相应的汇编指令。此过程包括以下几个步骤:
词法分析:将源代码分解成 tokens(词法单元)。
语法分析:根据语言的语法规则检查语句的正确性。
语义分析:检查程序的语义,例如变量是否已定义、类型是否匹配等。
编译的结果是一个扩展名为 .s 的汇编语言文件。
gcc -S hello.i -o hello.s
4.3 汇编
汇编阶段的任务是将汇编语言代码转换为机器码。GCC 使用汇编器(如 as)将 .s 文件转换为目标文件(.o 文件)。目标文件是二进制格式,包含了机器码和必要的符号信息。
gcc -c -hello.s -o hello.o
4.4 链接
最后一步是链接。链接器(如 ld)将一个或多个目标文件和所需的库文件(如标准库)结合起来,生成最终的可执行文件。链接器的主要任务包括:
- 符号解析:在目标文件之间解决函数和变量的引用。
- 地址分配:为代码和数据分配内存地址。
链接的结果是一个可执行的二进制文件,通常以无扩展名或 .out 扩展名表示。
gcc hello.o -o hello
4.5 动态链接和静态链接
静态链接
上面提到链接会将多个-o文件连接起来,形成一个可执行文件。
在我们的实际开发中,不可能将所有代码放在⼀个源⽂件中,所以会出现多个源⽂件,⽽且多个源⽂件之间不是独⽴的,⽽会存在多种依赖关系,如⼀个源⽂件可能要调⽤另⼀个源⽂件中定义的函数,
但是每个源⽂件都是独⽴编译的,即每个*.c⽂件会形成⼀个*.o⽂件,为了满⾜前⾯说的依赖关系,则需要将这些源⽂件产⽣的⽬标⽂件进⾏链接,从⽽形成⼀个可以执⾏的程序。这个链接的过程就是静态链接。
静态链接的缺点
很明显:
- 浪费空间:例如printf函数可能在多个源文件内都有使用,那么在每一个源文件内都会生成其.o文件,造成空间的浪费
- 不易更新和维护:每当代码更新和编译后,都会重新生成.o文件,这个时候就需要重新进⾏编译链接形成可执⾏程序。
优点:
在可执⾏程序中已经具备了所有执⾏程序所需要的任何东西,在
执⾏的时候运⾏速度快。
动态链接
动态链接的出现解决了静态链接的空间浪费问题,其基本思想为:
把程序安装模块拆分成各个相对独立的部分,在程序运行时才将他们链接形成一完整的程序,而不是像静态链接一样把所有程序模块都生成一个可执行程序。
五、函数库
在我们代码中,会有printf等函数,我们并没有对它们的实现,而预编译"stdio.h"中,也只有对它的声明,没有对它的实现,那么这些函数是在哪进行实现的呢?
其实系统把这些函数实现都被做到名为 libc.so.6
的库文件中去了,在没有特别指定时,gcc 会到系统默认的搜索路径“/usr/lib”下进行查找,也就是链接到 libc.so.6 库函数中去,这样就能实现函数“printf”了,而这也就是链接的作用
我们可以查看路径”usr/lib“中所有的函数:
函数库分为静态库和动态库两种
- 静态库是指在编译链接时,将库文件的代码全部加入可执行程序中,因此消耗空间较大,但此后也不需要再使用库文件,因为此时已包含其全部内容
其后缀一般为.a
- 动态库是指在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。
动态库一般后缀名为“.so”,如前面所述的 libc.so.6 就是动态库。
gcc 在编译时默认使用动态库。
完成了链接之后,gcc 就可以生成可执行文件
动态链接:
gcc test.c -o mytest
静态链接:
gcc test.c -o mytest -static
我们在平时使用时也不一定是纯动态链接或纯静态链接,也可能是两者混合
file指令可以帮助我们查看我们所调用的库类型
方式:file 可执行文件名
比如上面的hello文件:
我们就可以看到它调用的是.so结尾的动态库
六、常用选项
GCC 提供了多种选项,以满足不同的需求。以下是一些常用的选项:
-o : 指定输出文件名。
-Wall: 开启所有警告信息。
-g: 生成调试信息,用于调试程序。
-O: 优化级别,-O0(无优化)、-O1(基本优化)、-O2(较高优化)、-O3(最高优化)。
-c: 仅编译源代码,不进行链接,生成目标文件(.o)。
结语
在这个以速度与效率为主的时代,GCC无疑是开发者的得力助手。它不仅仅是一个工具,更是一个知识的载体,它让我们得以窥见编译的本质,理解计算机的运作方式。学习与掌握GCC,便是走向编程艺术的必由之路,愿每一位程序员都能在GCC的世界里,找到属于自己的那片自由天地。
本篇关于gcc和动静态库的讲解就暂告段落啦,希望能对大家的学习产生帮助,欢迎各位佬前来支持斧正!!!