Linux系统编程 —— 进程间通信 pipe、fifo

其他 2021-03-25 20:00:15 阅读次数: 0

Linux环境下，进程地址空间相互独立，每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到，所以进程和进程之间不能相互访问，要交换数据必须通过内核，在内核中开辟一块缓冲区，进程1把数据从用户空间拷到内核缓冲区，进程2再从内核缓冲区把数据读走，内核提供的这种机制称为进程间通信（IPC，InterProcess Communication）。

在进程间完成数据传递需要借助操作系统提供特殊的方法，如：文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展，一些方法由于自身设计缺陷被淘汰或者弃用。

现今常用的进程间通信方式有：

① 管道 (使用最简单)

② 信号 (开销最小)

③ 共享映射区 (无血缘关系)

④ 本地套接字 (最稳定)

管道

管道是一种最基本的IPC机制，作用于有血缘关系的进程之间，完成数据传递。调用pipe系统函数即可创建一个管道。

有如下特质：

1. 其本质是一个伪文件(实为内核缓冲区)

2. 由两个文件描述符引用，一个表示读端，一个表示写端。

3. 规定数据从管道的写端流入管道，从读端流出。

管道的原理: 管道实为内核使用环形队列机制，借助内核缓冲区(4k)实现（ulimit -a查看pipe size）。

管道的局限性：

① 数据自己读不能自己写。

② 数据一旦被读走，便不在管道中存在，即不可反复读取。

③ 由于管道采用半双工通信方式。因此，数据只能在一个方向上流动。

④ 只能在有公共祖先的进程间使用管道。

pipe函数

// 成功：0；    失败：-1，设置errno
int pipe(int pipefd[2]);

函数调用成功返回 r / w 两个文件描述符（传出参数）。无需open，但需手动close。

规定：fd[0] → r； fd[1] → w，就像0对应标准输入，1对应标准输出一样。向管道文件读写数据其实是在读写内核缓冲区。

管道创建成功以后，创建该管道的进程（父进程）同时掌握着管道的读端和写端。

如何实现父子进程间通信呢？通常可以采用如下步骤：

1. 父进程调用pipe函数创建管道，得到两个文件描述符fd[0]、fd[1]指向管道的读端和写端。

2. 父进程调用fork创建子进程，那么子进程也有两个文件描述符指向同一管道。

3. 父进程关闭管道读端，子进程关闭管道写端。父进程可以向管道中写入数据，子进程将管道中的数据读出。

由于管道是利用环形队列实现的，数据从写端流入管道，从读端流出，这样就实现了进程间通信。

练习：父子进程使用管道通信，父写入字符串，子进程读出并，打印到屏幕。【pipe_test.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>

int main() {
    pid_t pid;
    int fd[2];

    int ret;
    ret = pipe(fd);
    if (ret == -1) {
        perror("pipe error !!!");
        exit(1);
    }

    pid = fork();
    if (pid == -1) {
        perror("fork error !!!");
        exit(1);
    } else if (pid == 0) { // 子进程 - 读数据
        close(fd[1]);
        char buf[1024];
        ret = read(fd[0], buf, sizeof(buf));
        if (ret == 0) {
            printf("read finished.\n");
        }
        write(STDOUT_FILENO, buf, ret);
    } else if (pid > 0) { // 父进程 - 写数据
        close(fd[0]);
        char *content = "hello, ipc succssed !!!\n";
        write(fd[1], content, strlen(content));
    }

    wait(NULL); // 阻塞等待子进程，保证正常显示。

    return 0;
}

思考：为甚么，程序中没有使用sleep函数，但依然能保证子进程运行时一定会读到数据呢？

管道优缺点

优点：简单，相比信号，套接字实现进程间通信，简单很多。

缺点：1. 只能单向通信，双向通信需建立两个管道。

2. 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用fifo有名管道解决。

管道的读写行为

使用管道需要注意以下4种特殊情况（假设都是阻塞I/O操作，没有设置O_NONBLOCK标志）：

1. 如果所有指向管道写端的文件描述符都关闭了（管道写端引用计数为0），而仍然有进程从管道的读端读数据，那么管道中剩余的数据都被读取后，再次read会返回0，就像读到文件末尾一样。

2. 如果有指向管道写端的文件描述符没关闭（管道写端引用计数大于0），而持有管道写端的进程也没有向管道中写数据，这时有进程从管道读端读数据，那么管道中剩余的数据都被读取后，再次read会阻塞，直到管道中有数据可读了才读取数据并返回。

3. 如果所有指向管道读端的文件描述符都关闭了（管道读端引用计数为0），这时有进程向管道的写端write，那么该进程会收到信号SIGPIPE，通常会导致进程异常终止。当然也可以对SIGPIPE信号实施捕捉，不终止进程。具体方法信号章节详细介绍。

4. 如果有指向管道读端的文件描述符没关闭（管道读端引用计数大于0），而持有管道读端的进程也没有从管道中读数据，这时有进程向管道写端写数据，那么在管道被写满时再次write会阻塞，直到管道中有空位置了才写入数据并返回。

总结：

① 读管道：

1. 管道中有数据，read返回实际读到的字节数。

2. 管道中无数据：

(1) 管道写端被全部关闭，read返回0 (好像读到文件结尾)

(2) 写端没有全部被关闭，read阻塞等待(不久的将来可能有数据递达，此时会让出cpu)

② 写管道：

1. 管道读端全部被关闭，进程异常终止(也可使用捕捉SIGPIPE信号，使进程不终止)

2. 管道读端没有全部关闭：

(1) 管道已满，write阻塞。

(2) 管道未满，write将数据写入，并返回实际写入的字节数。

练习：使用管道实现父子进程间通信，完成：ls | wc –l。假定父进程实现ls，子进程实现wc。 ls命令正常会将结果集写出到stdout，但现在会写入管道的写端；wc –l 正常应该从stdin读取数据，但此时会从管道的读端读。【pipe1.c】

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>

int main(void)
{
    pid_t pid;
    int fd[2];

    pipe(fd);
    pid = fork();

    if (pid == 0) {  // child
        close(fd[1]);                   // 子进程从管道中读数据，关闭写端
        dup2(fd[0], STDIN_FILENO);      // 让wc从管道中读取数据
        execlp("wc", "wc", "-l", NULL); // wc命令默认从标准读入取数据
    } else {
        close(fd[0]);   // 父进程向管道中写数据，关闭读端
        dup2(fd[1], STDOUT_FILENO);     // 将ls的结果写入管道中
        execlp("ls", "ls", NULL);       // ls输出结果默认对应屏幕
    }

    // 使用sleep没用，是因为程序被替换执行不到这里。

    return 0;
}

程序执行，发现程序执行结束，shell还在阻塞等待用户输入。这是因为，shell → fork → ./pipe1，程序pipe1的子进程将stdin重定向给管道，父进程执行的ls会将结果集通过管道写给子进程。若父进程在子进程打印wc的结果到屏幕之前被shell调用wait回收，shell就会先输出$提示符。

练习：使用管道实现兄弟进程间通信。兄：ls 弟： wc -l 父：等待回收子进程。要求，使用“循环创建N个子进程”模型创建兄弟进程，使用循环因子i标示。注意管道读写行为。【pipe2.c】

#include <stdio.h>
#include <unistd.h>

int main () {
    pid_t pid;
    int i, fd[2];

    pipe(fd);

    for (i = 1; i <= 2; i++) {
        pid = fork();
        if (pid == 0) {
            break;
        }
    }

    if (pid == 0) { // 子进程
        switch(i) {
            case 1: // 子进程1，写端
                close(fd[0]);
                dup2(fd[1], STDOUT_FILENO);
                execlp("ls", "ls", NULL);
                break;
            case 2: // 子进程2，读端
                close(fd[1]);
                dup2(fd[0], STDIN_FILENO);
                execlp("wc", "wc", "-l", NULL);
                break;
        }
    } else {
        close(fd[0]);
        close(fd[1]);
        for (i = 1; i <= 2; i++) {
            wait(NULL);    // 两个子进程，wait两次
        }
    }


    return 0;
}

测试：是否允许，一个pipe有一个写端，多个读端呢？是否允许有一个读端多个写端呢？【pipe3.c】

课后作业: 统计当前系统中进程ID大于10000的进程个数。

> ps x | awk '{if($1 > 1000 && /[0-9]/) {cont++;print $1;}} END {print "user cont is ", cont}'
> ps x | awk '{if($1 > 1000 && /[0-9]/) cont++;} END {print cont}'

参考：

FIFO

FIFO常被称为命名管道，以区分管道(pipe)。管道(pipe)只能用于“有血缘关系”的进程间。但通过FIFO，不相关的进程也能交换数据。

FIFO是Linux基础文件类型中的一种。但，FIFO文件在磁盘上没有数据块，仅仅用来标识内核中一条通道。各进程可以打开这个文件进行read/write，实际上是在读写内核通道，这样就实现了进程间通信。

创建方式：

1. 命令：mkfifo 管道名

2. 库函数：

// 成功：0； 失败：-1
int mkfifo(const char *pathname,  mode_t mode);

filname是指文件名，而mode是指定文件的读写权限

一旦使用mkfifo创建了一个FIFO，就可以使用open打开它，常见的文件I/O函数都可用于fifo。

如：close、read、write、unlink等。【fifo_w.c/fifo_r.c】

// fifo_w.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <errno.h>

void sys_error(char *msg) {
    perror(msg);
    exit(1);
}

int main (int argc, char *argv[]) {
    int fd;

    int ret = mkfifo("mfifo", 0666);    // 创建命名管道
    if (ret == -1) {
        if (errno == EEXIST) {
            // fifo已存在
        } else {
            sys_error("mkfifo error !!!");
        }
    }

    fd = open("mfifo", O_WRONLY);    // 等待只读
	
    if (fd < 0) {
        sys_error("open fifo error.");;
    }

    // 没有数据前，读端read()阻塞
    char send[1024] = "Hello KuGou!!";
    write(fd, send, strlen(send));
    printf("write to mfifo buf =>[%s]\n", send);

    return 0;
}

// fifo_r.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>

void sys_error(char *msg) {
    perror(msg);
    exit(1);
}

int main (int argc, char *argv[]) {
    int fd;
	
    int ret = mkfifo("mfifo", 0666);    // 创建命名管道
    if (ret == -1) {
        if (errno == EEXIST) {
            // fifo已存在
        } else {
            sys_error("mkfifo error !!!");
        }
    }
	
    fd = open("mfifo", O_RDONLY);    // 等待只写

    if (fd < 0) {
        sys_error("open fifo error.");;
    }

    // 管道中没有数据就阻塞，有就读出
    char recv[1024] = {0};
    read(fd, recv, sizeof(recv));
    printf("recv to mfifo buf => [%s]\n", recv);

    return 0;
}

编译后，打开两个客户端分别执行。

练习：实现简单客户端通信，借助while，argc，argv方式创建fifo。

参考：