04-Linux系统编程-第01天（文件IO、阻塞非阻塞）

03-系统函数

系统编程章节大纲

1 文件I/O

2 文件系统

3 进程

4 进程间通信

5 信号

6 进程间关系

7 守护进程

8 线程

9 线程同步

10 网络基础

11 socket编程

12 高并发服务器

13 异步I/O

14 shell编程

Man page

1 命令和可执行程序

2 系统调用

3 标准库

系统调用本质就是函数

man 2 printf

man

严格来说write是 sys_write的浅封装

sys_write才是真正的系统调用不过一般我们就说write是系统调用

内核:操作系统内部核心程序

内核里包含一些驱动程序

printf 然后系统调用write函数驱动显卡输出

int 返回一个文件描述符

vim里查看man手册 K

光标移动到open 然后 2 K

fcntl.h 定义O_RDONLY宏

unistd.h 声明open系统调用

stdio.h 声明printf

只有当第二个参数为O_CREAT的时候才需要在第三个参数指定权限

(上面意思是读如果没有就创建)

最终创建出的文件的权限受第三个参数决定和umask一起决定

直接给结论:mode(第三个参数) & ~umask

mode 与 (umask取反)

比如umask是002 那么umask取反就是775

775与777 就是775

以只读方式打开如果文件不存在就创建如果文件已经存在就截断

(截断:把文件里内容清除掉)

文件描述符返回-1就是错了

04-read_write

想明白文件描述符本质

要先明白PCB

当执行./a.out的时候操作系统会虚拟出这样的虚拟地址

一个进程可能实际只使用几k 。但是可用地址范围有这么多

pcb 本质是一个结构体

里面有一个成员变量是指针

指针指向一个指针数组(可以理解为一个字符指针数组这个数组里面都是指针)

(int *p [N])

每一个指针指向字符串严谨的来说指向的还是结构体

(… 不明觉厉)

数组下标就理解为文件描述符

(实际上是一个指针指向结构体)

open一个文件时内核会维护一个结构体让我操作该文件,

man 2 read

read和write函数的使用:

05-cp命令实现

copy.c:

#include <fcntl.h>

#include <unistd.h>

#include <errno.h>

int main(int argc,char * argv[])

{

char buf[1024];

int ret = 0;

int fd1 = open(argv[1],O_RDONLY);

int fd2 = open(argv[2],O_RDWR |O_TRUNC|O_CREAT,0664);

while((ret = read(fd1,buf,sizeof(buf))) != 0 )

{

write(fd2,buf,ret);

}

close(fd1);

close(fd2);

}

06-预读入缓输出

每当执行一个a.out的时候在kernal里就会有一个与之唯一对应的PCB进程控制块

注意:

read 返回的是实际读到的字节数

write的时候第三个参数应该传这个字节数而不是像read一样是buf的大小

C标库一次读一个字符

#include <stdio.h>

#include <stdlib.h>

int main(void)

{

FILE *fp,*fp_out;

int n;

fp = fopen(“dict.txt”,”r”);

if(fp == NULL) {

perror(“fopen error”);

exit(1)

}

fp_out = fopen(“dict.cp”,”w”);

if(fp == NULL) {

perror(“fopen error”);

exit(1);

}

while((n = fgetc(fp))!=EOF) {

fputc(n,fp_out);

}

fclose(fp);

fclose(fp_out);

return 0;

}

系统调用一次读一个字符:

#include <stdlib.h>

#include <errno.h>

#define N 1

int main(int argc,char * argv[])

{

int fd,fd_out;

int n;

char buf[N];

fd = open(“dict.txt”,O_RDONLY);

if(fd < 0){

perror(“open dict.txt error”);

exit(1);

}

fd_out = open(“dict.cp”,O_WRONLY|O_CREAT|O_TRUNC,0644);

if(fd<0){

perror(“open dict.cp error”);

exit(1);

}

close(fd);

close(fd_out);

return 0;

}

实际跑了一遍发现用read函数一个字节一个字节读还不如用fgetc速度块..

用系统调用不仅没快反而奇慢

知识点:

预读入缓输出

预读入缓输出机制

我们认为用户程序用户定义buf直接使用系统调用write函数跳过了标准库函数进入kernal

让kernal写到磁盘文件上了

实际上不是这样的:

实际上在内核中默认也维护了一个缓冲区默认是4096byte

内核为了提高效率会一次性等缓冲区满以后再刷到磁盘上

当自己写的write函数写的时候实际上没有写到磁盘上，而是在内核的缓冲区

这种机制称为缓输出

C标准库函数自己带着一个缓冲区

fgetc fputc。。。这些内部实现包含缓冲区

fgetc读字符会放到自己的缓冲区里

读4096字节放到自己的蓝色框缓冲区里

然后向下系统调用 write

把数据写到内核的缓冲区

然后再刷到磁盘上

之所以慢是因为

从用户区切换到内核区这个时间消耗很大。

直接系统调用write的方法从用户区到内核区的切换工作耗了很多时间每次一个字节就要切换一次

用fgetc fputc 只切换了一次

下面验证一下…:

strace 命令跟踪程序运行时间的系统调用

结果: 每次读写字节都切换

结果:

每次4096个总的切换次数少很多

预读入:

一次性把缓冲区读满

需要的时候就从缓冲区取

既然效率这么低那么学习系统调用write函数有啥用直接用标库函数不就得了..?

答案: 比如qq聊天要求即时性，不是要等4096个byte再发过去

emm 把刚才write函数的define N 1 改成 1024 就能发现快很多了

把数据交给内核内核什么时间写到磁盘上由内核决定交给它内部的I/O优化算法。

07-错误处理函数

建议对所有的系统调用做错误处理

不使用printf打印错误了

使用perror

(perror不需要加\n)

结果:

还有一个strerror(不常用

08-阻塞非阻塞

终端设备是指: 0 标准输入 1 标准输出 3 标准错误

当cat的时候就阻塞了

stdin stdout stderror对应的文件都是设备文件 dev下面的tty

下面看三个小程序

读常规文件是不会阻塞的，不管读多少字节，read一定会在有限的时间内返回。从终端设备或网络读则不一定，如果从终端输入的数据没有换行符，调用read读终端设备就会阻塞，如果网络上没有接收到数据包，调用read从网络读就会阻塞，至于会阻塞多长时间也是不确定的，如果一直没有数据到达就一直阻塞在那里。同样，写常规文件是不会阻塞的，而向终端设备或网络写则不一定。

现在明确一下阻塞（Block）这个概念。当进程调用一个阻塞的系统函数时，该进程被置于睡眠（Sleep）状态，这时内核调度其它进程运行，直到该进程等待的事件发生了（比如网络上接收到数据包，或者调用sleep指定的睡眠时间到了）它才有可能继续运行。与睡眠状态相对的是运行（Running）状态，在Linux内核中，处于运行状态的进程分为两种情况：

正在被调度执行。CPU处于该进程的上下文环境中，程序计数器（eip）里保存着该进程的指令地址，通用寄存器里保存着该进程运算过程的中间结果，正在执行该进程的指令，正在读写该进程的地址空间。

就绪状态。该进程不需要等待什么事件发生，随时都可以执行，但CPU暂时还在执行另一个进程，所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进程，那么该调度谁执行呢？内核的调度算法是基于优先级和时间片的，而且会根据每个进程的运行情况动态调整它的优先级和时间片，让每个进程都能比较公平地得到机会执行，同时要兼顾用户体验，不能让和用户交互的进程响应太慢。

阻塞读终端：【block_readtty.c】

非阻塞读终端【nonblock_readtty.c】

非阻塞读终端和等待超时【nonblock_timeout.c】

注意，阻塞与非阻塞是对于文件而言的。而不是read、write等的属性。read终端，默认阻塞读。

总结read 函数返回值：

1. 返回非零值：实际read到的字节数

2. 返回-1： 1）：errno != EAGAIN (或!= EWOULDBLOCK) read出错

2）：errno == EAGAIN (或== EWOULDBLOCK) 设置了非阻塞读，并且没有数据到达。

3. 返回0：读到文件末尾

1.阻塞读终端:

block_readtty.c: