fork函数,为什么有两次返回?

前言

fork函数用于创建一个新进程,称为子进程,它与旧进程(称为系统调用fork的进程)同时运行,此进程称为父进程

创建新的子进程后,两个进程将执行fork()系统调用之后的下一条指令。子进程使用相同的pc(程序计数器)、相同的CPU寄存器、在父进程中使用的相同打开文件。它不需要参数并返回一个整数值。

下面是fork()返回的不同值:

  • 负值:创建子进程失败。
  • 零:返回到新创建的子进程。
  • 正值:返回父进程或调用者。该值包含新创建的子进程的进程ID

失败的两个主要原因:

  1. 当前系统的进程数已经达到了系统规定的上限,这时Error Codes的值被设置为 EAGAIN
  2. 系统内存不足,这时Error Codes的值被设置为 ENOMEM

代码示例

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
 
int main() {
    printf("before fork: \n");
    pid_t pid = fork();			//进程从当前位置开始分裂为父进程和子进程,分别开始交替向前并发执行,区分在于pid不同
    printf("after fork: \n");
    if (pid == -1) {
        perror("fork");
    }
 
    if (pid > 0) {
        printf("pid: %d\n", pid);
        //程序在父进程,返回子进程的pid
        printf("this is parent process, pid: %d, ppid: %d\n",  getpid(), getppid());
    } else if (pid == 0){
        //程序在子进程,它没有子进程,返回0
        printf("this is child process, pid: %d, ppid: %d\n",  getpid(), getppid());
    }
 
    for (int i = 0; i < 5; i++) {
        printf("i: %d, pid: %d\n", i, getpid());
        sleep(1);
    }
 
    return 0;
}

输出结果如下:

before fork: 			
after fork: 				#父进程先执行
pid: 146087					#父进程的返回值是子进程的pid
this is parent process, pid: 146086, ppid: 144773
i: 0, pid: 146086			#父进程自己的pid
after fork: 				#子进程开始执行
this is child process, pid: 146087, ppid: 146086 #子进程pid, ppid
i: 0, pid: 146087  				#子进程pid		linux时间片为4ms~x00ms
i: 1, pid: 146086				#父进程pid
i: 1, pid: 146087
i: 2, pid: 146086
i: 2, pid: 146087
i: 3, pid: 146086
i: 3, pid: 146087
i: 4, pid: 146086
i: 4, pid: 146087

为什么fork会返回两次?

由于在复制时复制了父进程的堆栈段,所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。过程如下图。

fork调用的一个奇妙之处就是 它仅仅被调用一次却能够返回两次,它可能有三种不同的返回值:

(1)在父进程中,fork返回新创建子进程的进程ID;
(2)在子进程中,fork返回0;
(3)如果出现错误,fork返回一个负值。

在fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

引用一位网友的话来解释fork函数返回的值为什么在父子进程中不同。“其实就相当于链表,进程形成了链表,父进程的fork函数返回的值指向子进程的进程id, 因为子进程没有子进程,所以其fork函数返回的值为0.

调用fork之后,数据、堆、栈有两份,代码仍然为一份但是这个代码段成为两个进程的共享代码段都从fork函数中返回,箭头表示各自的执行处。当父子进程有一个想要修改数据或者堆栈时,两个进程真正分裂。

子进程代码是从fork处开始执行的, 为什么不是从#include处开始复制代码的?这是因为fork是把 进程当前的情况拷贝一份 , 执行fork时,进程已经执行完了前面部分逻辑。fork只拷贝下一个要执行的代码到新的进程。

猜你喜欢

转载自blog.csdn.net/Jason_Lee155/article/details/131523130