函数调用堆栈
函数调用相信大家都不陌生,调用函数向被调用函数传递参数,然后执行被调用函数的代码,最后被调用函数向调用函数返回结果。
函数的调用实际上就是在栈上发生的,那么函数调用在计算机内部到底是如何实现的呢?
对于一个程序,编译器会对其分配一段内存,这段内存在逻辑上可以分为:代码段、数据段、堆和栈。
(1)代码段:保存程序的文本,指令指针 eip 就是指向代码段,可读可执行不可写
(2)数据段(.data):保存已初始化且不为 0 的全局变量和静态变量,可读可写不可执行
(3).bbs:保存未初始化且为 0 的全局变量和静态变量
(4)堆(heap):动态分配内存,向地址增大的方向增长,可读可写可执行
(5)栈(stack):存放局部变量、函数参数、当前状态和函数调用信息等,向地址减小的方向增长,可读可写可执行
在程序运行起来以后,代码生成了数据和指令,由操作系统给每个数据提供了虚拟的地址空间,那么这些虚拟地址空间是如何分配的呢?
如下图所示:
在函数调用时,第一个进栈的是主函数中函数调用后的下一条指令的地址(函数调用语句的下一条可执行语句的地址)然后是函数的各个参数,在大多数的 C 编译器中,参数是从右往左入栈的,然后是函数中的局部变量。(注意:静态变量是不入栈的)
当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序从该点继续运行。
以下面的函数调用为例:
#include <stdio.h> int sum(int a, int b) { int temp = 0; temp = a + b; return temp; } int main() { int a = 10; int b = 20; int ret = 0; ret = sum(a, b); printf("%d\n", ret); return 0; }
首先是 a, b, ret 三个变量先入栈
那么在函数调用时栈空间又是如何开辟并存放数据的呢?
(1)调用函数把(main)被调用函数(sum)所需要的参数按照与被调用函数的形参顺序相反的顺序压入栈中。
(即从右向左依次将被调用函数所需要的参数压入栈中)
(2)调用函数使用 call 指令调用被调用函数,并把 call 指令的下一条指令的地址当成返回式的地址压入栈中。
call 指令在这里有两个作用:一是把下一条指令的地址压入栈,而是起到跳转的作用,即跳转到被调用函数中执行。
(3)在被调用函数中,被调用函数会保存调用函数的栈底地址(push ebp),然后保存调用函数的栈顶地址,同时也是当前被调用函数的栈底地址(mov ebp,esp)。
(4)注意变量的地址是按照栈的延伸方向排列的,先定义的变量先入栈
如下图所示: