GCC-程序编译过程

本文以gcc为编译工具记录下程序的编译过程


编译(总)

当我们写好一个简单的helloword程序,需要把程序转化为可执行文件时,需要经历的一个步骤就是编译。

hello.c
-----------------------------------------------
#include <stdio.h>

#define X 1

int main()
{
        int i=0;
        printf("hello world X = %d i=%d !\n",X,i);
        return 0;
}

如果使用的编译工具是gcc,只需要一个 gcc hello.c 便可以编译完输出a.out文件。但是简单的编译中包含着几个步骤--预编译、编译、汇编、链接(严格说链接并不属于编译流程,这里直接一起讲了),了解这些步骤有助于加深对程序的理解。

预编译

C语言中有着以'#'开头的预处理指令,包括#ifdef 、#include和#define等都属于预编译指令。预编译阶段,gcc会将预编译指令做处理,将使用到宏定义#define的地方展开成真实值,将#include的头文件赋值到文件中等,但是不会检查复制之后是否正确,正确性交给后续流程处理。

gcc -E -o hello.i hello.c

如上,让gcc只执行预编译流程需要添加 -E 选项,同时一般预编译的输出文件为.i后缀。这里节选了部分的结果文件,可以看到#include展开后相关的头文件和声明都被复制到该文件中,同时main函数中使用到#define X的地方也被替换成实际的1。

# 1 "hello.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "<command-line>" 2
# 1 "hello.c"
# 1 "/usr/include/stdio.h" 1 3 4
# 27 "/usr/include/stdio.h" 3 4
# 1 "/usr/include/features.h" 1 3 4
# 367 "/usr/include/features.h" 3 4
# 1 "/usr/include/x86_64-linux-gnu/sys/cdefs.h" 1 3 4
# 410 "/usr/include/x86_64-linux-gnu/sys/cdefs.h" 3 4
# 1 "/usr/include/x86_64-linux-gnu/bits/wordsize.h" 1 3 4
# 411 "/usr/include/x86_64-linux-gnu/sys/cdefs.h" 2 3 4
# 368 "/usr/include/features.h" 2 3 4
# 391 "/usr/include/features.h" 3 4
# 1 "/usr/include/x86_64-linux-gnu/gnu/stubs.h" 1 3 4
# 10 "/usr/include/x86_64-linux-gnu/gnu/stubs.h" 3 4
# 1 "/usr/include/x86_64-linux-gnu/gnu/stubs-64.h" 1 3 4
# 11 "/usr/include/x86_64-linux-gnu/gnu/stubs.h" 2 3 4
# 392 "/usr/include/features.h" 2 3 4
# 28 "/usr/include/stdio.h" 2 3 4

...
...


extern int fprintf (FILE *__restrict __stream,
      const char *__restrict __format, ...);


extern int printf (const char *__restrict __format, ...);

...
...

# 5 "hello.c"
int main()
{
 int i=0;
 printf("hello world X = %d i=%d !\n",1,i);
 return 0;
}

编译

在上述文件基础上需要执行的下一个流程是编译,这里的编译和本文开头的编译不是一回事,开头的编译是对本文所要讲解的几个流程的简称。而本处的编译指的是将预编译后的文件进行编译,仅为其中的一个流程。编译会生成对应机器的汇编码,同样以hello.c预编译完成的hello.i为例,使用 -S 参数执行编译流程。

gcc -S -o hello.s hello.i
        .file   "hello.c"
        .section        .rodata
.LC0:
        .string "hello world X = %d i=%d !\n"
        .text
        .globl  main
        .type   main, @function
main:
.LFB0:
        .cfi_startproc
        pushq   %rbp
        .cfi_def_cfa_offset 16
        .cfi_offset 6, -16
        movq    %rsp, %rbp
        .cfi_def_cfa_register 6
        subq    $16, %rsp
        movl    $0, -4(%rbp)
        movl    -4(%rbp), %eax
        movl    %eax, %edx
        movl    $1, %esi
        movl    $.LC0, %edi
        movl    $0, %eax
        call    printf
        movl    $0, %eax
        leave
        .cfi_def_cfa 7, 8
        ret
        .cfi_endproc
.LFE0:
        .size   main, .-main
        .ident  "GCC: (Ubuntu 5.4.0-6ubuntu1~16.04.12) 5.4.0 20160609"
        .section        .note.GNU-stack,"",@progbits

汇编,链接

汇编阶段做的是将编译流程输出的汇编码转化为二进制机器码,但是还不能直接运行,需要链接上依赖的库或者文件才能得到最终的可执行文件。汇编过程使用 -c 参数,链接则直接将需要链接的.o文件直接执行gcc即可。

gcc -c -o hello.o hello.s
gcc -o hello hello.o

示例中的链接仅列出了我们自己的hello.o,没有看到其他依赖的库,但是仍然能够链接成功且能够正常执行,这是因为依赖的系统库在这个过程中被默认加载了,这里直接在链接时gcc中加入 -v 参数就能观察到,

 gcc -v -o hello  hello.o
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.0-6ubuntu1~16.04.12' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.12)
COMPILER_PATH=/usr/lib/gcc/x86_64-linux-gnu/5/:/usr/lib/gcc/x86_64-linux-gnu/5/:/usr/lib/gcc/x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/5/:/usr/lib/gcc/x86_64-linux-gnu/
LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/5/:/usr/lib/gcc/x86_64-linux-gnu/5/../../../x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/5/../../../../lib/:/lib/x86_64-linux-gnu/:/lib/../lib/:/usr/lib/x86_64-linux-gnu/:/usr/lib/../lib/:/usr/lib/gcc/x86_64-linux-gnu/5/../../../:/lib/:/usr/lib/
COLLECT_GCC_OPTIONS='-v' '-o' 'hello' '-mtune=generic' '-march=x86-64'
 /usr/lib/gcc/x86_64-linux-gnu/5/collect2 -plugin /usr/lib/gcc/x86_64-linux-gnu/5/liblto_plugin.so -plugin-opt=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper -plugin-opt=-fresolution=/tmp/ccLdFZul.res -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s -plugin-opt=-pass-through=-lc -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s --sysroot=/ --build-id --eh-frame-hdr -m elf_x86_64 --hash-style=gnu --as-needed -dynamic-linker /lib64/ld-linux-x86-64.so.2 -z relro -o hello /usr/lib/gcc/x86_64-linux-gnu/5/../../../x86_64-linux-gnu/crt1.o /usr/lib/gcc/x86_64-linux-gnu/5/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/5/crtbegin.o -L/usr/lib/gcc/x86_64-linux-gnu/5 -L/usr/lib/gcc/x86_64-linux-gnu/5/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/5/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/5/../../.. hello.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/x86_64-linux-gnu/5/crtend.o /usr/lib/gcc/x86_64-linux-gnu/5/../../../x86_64-linux-gnu/crtn.o

使用-v参数后的输出如上,使用ctrl+f搜索可以看到 -lc 的参数出现,这是链接了系统的libc库,直接使用 ldd 命令也可以看到最终生成的可执行文件hello所依赖的库。

CryptonymAMS$: ldd hello
        linux-vdso.so.1 =>  (0x00007ffc397a6000)
        libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f4a8ed33000)
        /lib64/ld-linux-x86-64.so.2 (0x00007f4a8f0fd000)

这里hello采用了动态链接链接到系统库,可以使用 file 命令查看到dynamically linked,也就是动态链接的方式。

hello: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/l, for GNU/Linux 2.6.32, BuildID[sha1]=ac17e411d6f0b61087de124ee029056f09f4c990, not stripped

至此,gcc的所有编译流程结束,可执行文件输出。

 

补充

gcc的常用参数

-E :执行到预编译流程就停止,不执行后续编译、汇编等流程
-S :只执行到编译流程,不执行后续汇编等流程
-c :只执行到汇编流程,不执行链接流程

-o :指定输出文件的名字

-I :指定头文件路径
-L :指定库文件路径
-l :指定需要链接的库(如libc.so,只需要 -lc 即可)

-static :静态链接方式(可执行文件包含执行需要的所有信息,但是文件大小会比较大)
-nostdlib :不链接标准库

-v :查看gcc版本信息,编译过程使用时用于打印编译过程的输出

更多参数可以直接man gcc或者gcc --help查看。

发布了19 篇原创文章 · 获赞 7 · 访问量 6927

猜你喜欢

转载自blog.csdn.net/G_METHOD/article/details/104163168
今日推荐