Linux环境下,进程地址空间相互独立,每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到,所以进程和进程之间不能相互访问,要交换数据必须通过内核,在内核中开辟一块缓冲区,进程1把数据从用户空间拷到内核缓冲区,进程2再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信(IPC,InterProcess Communication)。
在进程间完成数据传递需要借助操作系统提供特殊的方法,如:文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展,一些方法由于自身设计缺陷被淘汰或者弃用。
现今常用的进程间通信方式有:
① 管道 (使用最简单)
② 信号 (开销最小)
③ 共享映射区 (无血缘关系)
④ 本地套接字 (最稳定)
管道
管道是一种最基本的IPC机制,作用于有血缘关系的进程之间,完成数据传递。调用pipe系统函数即可创建一个管道。
有如下特质:
1. 其本质是一个伪文件(实为内核缓冲区)
2. 由两个文件描述符引用,一个表示读端,一个表示写端。
3. 规定数据从管道的写端流入管道,从读端流出。
管道的原理: 管道实为内核使用环形队列机制,借助内核缓冲区(4k)实现(ulimit -a查看pipe size)。
管道的局限性:
① 数据自己读不能自己写。
② 数据一旦被读走,便不在管道中存在,即不可反复读取。
③ 由于管道采用半双工通信方式。因此,数据只能在一个方向上流动。
④ 只能在有公共祖先的进程间使用管道。
pipe函数
// 成功:0; 失败:-1,设置errno
int pipe(int pipefd[2]);
函数调用成功返回 r / w 两个文件描述符(传出参数)。无需open,但需手动close。
规定:fd[0] → r; fd[1] → w,就像0对应标准输入,1对应标准输出一样。 向管道文件读写数据其实是在读写内核缓冲区。
管道创建成功以后,创建该管道的进程(父进程)同时掌握着管道的读端和写端。
如何实现父子进程间通信呢?通常可以采用如下步骤:
1. 父进程调用pipe函数创建管道,得到两个文件描述符fd[0]、fd[1]指向管道的读端和写端。
2. 父进程调用fork创建子进程,那么子进程也有两个文件描述符指向同一管道。
3. 父进程关闭管道读端,子进程关闭管道写端。父进程可以向管道中写入数据,子进程将管道中的数据读出。
由于管道是利用环形队列实现的,数据从写端流入管道,从读端流出,这样就实现了进程间通信。
练习:父子进程使用管道通信,父写入字符串,子进程读出并,打印到屏幕。 【pipe_test.c】
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
int main() {
pid_t pid;
int fd[2];
int ret;
ret = pipe(fd);
if (ret == -1) {
perror("pipe error !!!");
exit(1);
}
pid = fork();
if (pid == -1) {
perror("fork error !!!");
exit(1);
} else if (pid == 0) { // 子进程 - 读数据
close(fd[1]);
char buf[1024];
ret = read(fd[0], buf, sizeof(buf));
if (ret == 0) {
printf("read finished.\n");
}
write(STDOUT_FILENO, buf, ret);
} else if (pid > 0) { // 父进程 - 写数据
close(fd[0]);
char *content = "hello, ipc succssed !!!\n";
write(fd[1], content, strlen(content));
}
wait(NULL); // 阻塞等待子进程,保证正常显示。
return 0;
}
思考:为甚么,程序中没有使用sleep函数,但依然能保证子进程运行时一定会读到数据呢?
管道优缺点
优点:简单,相比信号,套接字实现进程间通信,简单很多。
缺点:1. 只能单向通信,双向通信需建立两个管道。
2. 只能用于父子、兄弟进程(有共同祖先)间通信。该问题后来使用fifo有名管道解决。
管道的读写行为
使用管道需要注意以下4种特殊情况(假设都是阻塞I/O操作,没有设置O_NONBLOCK标志):
1. 如果所有指向管道写端的文件描述符都关闭了(管道写端引用计数为0),而仍然有进程从管道的读端读数据,那么管道中剩余的数据都被读取后,再次read会返回0,就像读到文件末尾一样。
2. 如果有指向管道写端的文件描述符没关闭(管道写端引用计数大于0),而持有管道写端的进程也没有向管道中写数据,这时有进程从管道读端读数据,那么管道中剩余的数据都被读取后,再次read会阻塞,直到管道中有数据可读了才读取数据并返回。
3. 如果所有指向管道读端的文件描述符都关闭了(管道读端引用计数为0),这时有进程向管道的写端write,那么该进程会收到信号SIGPIPE,通常会导致进程异常终止。当然也可以对SIGPIPE信号实施捕捉,不终止进程。具体方法信号章节详细介绍。
4. 如果有指向管道读端的文件描述符没关闭(管道读端引用计数大于0),而持有管道读端的进程也没有从管道中读数据,这时有进程向管道写端写数据,那么在管道被写满时再次write会阻塞,直到管道中有空位置了才写入数据并返回。
总结:
① 读管道:
1. 管道中有数据,read返回实际读到的字节数。
2. 管道中无数据:
(1) 管道写端被全部关闭,read返回0 (好像读到文件结尾)
(2) 写端没有全部被关闭,read阻塞等待(不久的将来可能有数据递达,此时会让出cpu)
② 写管道:
1. 管道读端全部被关闭, 进程异常终止(也可使用捕捉SIGPIPE信号,使进程不终止)
2. 管道读端没有全部关闭:
(1) 管道已满,write阻塞。
(2) 管道未满,write将数据写入,并返回实际写入的字节数。
练习:使用管道实现父子进程间通信,完成:ls | wc –l。假定父进程实现ls,子进程实现wc。 ls命令正常会将结果集写出到stdout,但现在会写入管道的写端;wc –l 正常应该从stdin读取数据,但此时会从管道的读端读。 【pipe1.c】
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
int main(void)
{
pid_t pid;
int fd[2];
pipe(fd);
pid = fork();
if (pid == 0) { // child
close(fd[1]); // 子进程从管道中读数据,关闭写端
dup2(fd[0], STDIN_FILENO); // 让wc从管道中读取数据
execlp("wc", "wc", "-l", NULL); // wc命令默认从标准读入取数据
} else {
close(fd[0]); // 父进程向管道中写数据,关闭读端
dup2(fd[1], STDOUT_FILENO); // 将ls的结果写入管道中
execlp("ls", "ls", NULL); // ls输出结果默认对应屏幕
}
// 使用sleep没用,是因为程序被替换执行不到这里。
return 0;
}
程序执行,发现程序执行结束,shell还在阻塞等待用户输入。这是因为,shell → fork → ./pipe1, 程序pipe1的子进程将stdin重定向给管道,父进程执行的ls会将结果集通过管道写给子进程。若父进程在子进程打印wc的结果到屏幕之前被shell调用wait回收,shell就会先输出$提示符。
练习:使用管道实现兄弟进程间通信。 兄:ls 弟: wc -l 父:等待回收子进程。 要求,使用“循环创建N个子进程”模型创建兄弟进程,使用循环因子i标示。注意管道读写行为。 【pipe2.c】
#include <stdio.h>
#include <unistd.h>
int main () {
pid_t pid;
int i, fd[2];
pipe(fd);
for (i = 1; i <= 2; i++) {
pid = fork();
if (pid == 0) {
break;
}
}
if (pid == 0) { // 子进程
switch(i) {
case 1: // 子进程1,写端
close(fd[0]);
dup2(fd[1], STDOUT_FILENO);
execlp("ls", "ls", NULL);
break;
case 2: // 子进程2,读端
close(fd[1]);
dup2(fd[0], STDIN_FILENO);
execlp("wc", "wc", "-l", NULL);
break;
}
} else {
close(fd[0]);
close(fd[1]);
for (i = 1; i <= 2; i++) {
wait(NULL); // 两个子进程,wait两次
}
}
return 0;
}
测试:是否允许,一个pipe有一个写端,多个读端呢?是否允许有一个读端多个写端呢? 【pipe3.c】
课后作业: 统计当前系统中进程ID大于10000的进程个数。
> ps x | awk '{if($1 > 1000 && /[0-9]/) {cont++;print $1;}} END {print "user cont is ", cont}'
> ps x | awk '{if($1 > 1000 && /[0-9]/) cont++;} END {print cont}'
参考:
FIFO
FIFO常被称为命名管道,以区分管道(pipe)。管道(pipe)只能用于“有血缘关系”的进程间。但通过FIFO,不相关的进程也能交换数据。
FIFO是Linux基础文件类型中的一种。但,FIFO文件在磁盘上没有数据块,仅仅用来标识内核中一条通道。各进程可以打开这个文件进行read/write,实际上是在读写内核通道,这样就实现了进程间通信。
创建方式:
1. 命令:mkfifo 管道名
2. 库函数:
// 成功:0; 失败:-1
int mkfifo(const char *pathname, mode_t mode);
filname是指文件名,而mode是指定文件的读写权限
一旦使用mkfifo创建了一个FIFO,就可以使用open打开它,常见的文件I/O函数都可用于fifo。
如:close、read、write、unlink等。 【fifo_w.c/fifo_r.c】
// fifo_w.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <errno.h>
void sys_error(char *msg) {
perror(msg);
exit(1);
}
int main (int argc, char *argv[]) {
int fd;
int ret = mkfifo("mfifo", 0666); // 创建命名管道
if (ret == -1) {
if (errno == EEXIST) {
// fifo已存在
} else {
sys_error("mkfifo error !!!");
}
}
fd = open("mfifo", O_WRONLY); // 等待只读
if (fd < 0) {
sys_error("open fifo error.");;
}
// 没有数据前,读端read()阻塞
char send[1024] = "Hello KuGou!!";
write(fd, send, strlen(send));
printf("write to mfifo buf =>[%s]\n", send);
return 0;
}
// fifo_r.c
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
void sys_error(char *msg) {
perror(msg);
exit(1);
}
int main (int argc, char *argv[]) {
int fd;
int ret = mkfifo("mfifo", 0666); // 创建命名管道
if (ret == -1) {
if (errno == EEXIST) {
// fifo已存在
} else {
sys_error("mkfifo error !!!");
}
}
fd = open("mfifo", O_RDONLY); // 等待只写
if (fd < 0) {
sys_error("open fifo error.");;
}
// 管道中没有数据就阻塞,有就读出
char recv[1024] = {0};
read(fd, recv, sizeof(recv));
printf("recv to mfifo buf => [%s]\n", recv);
return 0;
}
编译后,打开两个客户端分别执行。
练习:实现简单客户端通信,借助while,argc,argv方式创建fifo。
参考: