1.文件理解
1.狭义理解
2.⼴义理解
3.⽂件操作的归类认知
2.c语言的文件操作复习
1.读文件
#include <stdio.h>
#include <string.h>
int main() {
FILE* fp = fopen("myfile", "r");
if (!fp) {
printf("fopen error!\n");
return 1;
}
char buf[1024];
const char* msg = "hello bit!\n";
while (1) {
// 注意返回值和参数,此处有坑,仔细查看man⼿册关于该函数的说明
ssize_t s = fread(buf, 1, strlen(msg), fp);
if (s > 0) {
buf[s] = 0;
printf("%s", buf);
}
if (feof(fp)) {
break;
}
}
fclose(fp);
return 0;
}
可以在centos环境下,稍作修改,实现简单cat命令:
#include <stdio.h>
#include <string.h>
int main(int argc, char* argv[]) {
//输入类似 ./test log.txt
if (argc != 2) {
printf("argv error!\n");
return 1;
}
FILE* fp = fopen(argv[1], "r");
if (!fp) {
printf("fopen error!\n");
return 2;
}
char buf[1024];
while (1) {
int s = fread(buf, 1, sizeof(buf), fp);// 参数分别表示,读到buf中去,每次读一个,一个的字节大小,要打开的文件名
if (s > 0) {
buf[s] = 0;
printf("%s", buf);
}
if (feof(fp)) {
//如果读到文件的结尾了,就退出
break;
}
}
fclose(fp);
return 0;
}
2.各种方式实现在centos环境的屏幕上打印
- 为什么fwrite也可以打印呢?-------------因为linux系统下一切皆文件,屏幕也是一个文件,所以打印等于把数据写入屏幕文件
3.三大输入输出流
1.如果只以写的方式--------fopen(,“w
”)打开文件,但什么都不写,会发生什么?
答案是,文件会被清空,因为文件被打开时,默认被清空。
还记得之前得echo 。。。 > log.txt
-----重定向命令,如果只输入> log.txt
会发生什么呢?
- 没错,
log.txt会被清空
,和fopen只打开文件不写是一个道理
2.如果只以写的方式--------fopen(,“a
”)打开文件,但什么都不写,会发生什么?
答案是,文件不会被清空,如果写入东西的话,不是重新写文件,而是在原来文件得结尾处继续输入内容
- 类似echo …>>log.txt--------不清空文件,而是在末尾处新插入内容
4.系统提供的基础接口
1.open函数
- 如果打开成功,就会返回文件描述符
举例说明:
- 使用O_CREAT一定要加权限。,0666代表权限-rw-rw-rw-
运行结果如下:
- 为什么最后是-rw-rw-r–捏?因为系统自带umask码,为0002。
- 原来的0666-0002=0664即-rw-rw-r–。
- 可以这样就解决。
2.close函数
- close(文件描述符)------关闭文件
3.write函数
1.代码示例
运行结果如下:
添加清空功能,每次打开文件需要清空文件
,需要在open函数中添加 O_TRUNC
宏
添加尾部写入,,需要在open函数中添加 O_APPEND
2.二进制写入VS文本写入
- 二进制写入
- 文本写入
总结:
- 是二进制形式写入还是文本形式写入,取决于你自己。
4.read函数
- 返回值是成功读取的字节数
- 如果读到文件末尾了就返回0
- 如果读取失败就返回一个小于0的数
5.fd文件描述符
1.代码示例
打印结果如下:
- 为什么没有0,1,2呢?
- 因为0,1,2分别是标准输入,标准输出,标准错误,一开始就已经打开了,不需要在使用open函数打开
2.file类型解释
在c语言的fopen函数中,类型是FILE,那么FILE到底是什么类型呢?
- 上文已说明file是一个结构体,所以使用->fileno打印文件描述符fd
结果如下:
3.fd的本质
进程打开为1:n的形式,什么意思?就是指一个进程可以打开多个文件,那怎么管理打开的文件呢?
- 每个文件被打开时,都会创建一个FILE*结构体,里面存放着文件的各种数据和属性,通过管理这些结构体就能管理好文件
- 但是结构体也有很多个,这个时候我们可以想到用数组来存储他们,数组的下标就是
fd
- 文件描述符表是一个结构体,里面存着一个指针数组,每个元素就是一个文件对应的FILE结构体的地址
4.重定向
- 这是一个重定向的例子
dup2函数的使用:
5.cout与cerr打印
- 二者的fd分别为1和2,默认输出都是显示器。
那么,如何让cout和cerr的内容都打印到同一个文件内呢?
- 这样才是正确的
6.一切皆文件
linux视角下一切皆文件,为什么这么说呢?
- 如上图,每一个文件/设备都有一个对应的struct file,设备还另外拥有一个struct device用来存储属性与状态
- 可以看到在底层上每一个设备都有其对应的读写操作
- 而每一个struct file中都有两个函数指针,分别为read和write,分别对应其对应的设备的读写操作
- 但在上层看来,
所有的读写函数都是同名的
,所以不会意识到设备和文件有差距,便认为所有设备都是文件
3.缓冲区
缓冲区是内存空间的⼀部分。也就是说,在内存空间中预留了⼀定的存储空间,这些存储空间⽤来缓
冲输⼊或输出的数据,这部分预留的空间就叫做缓冲区。缓冲区根据其对应的是输⼊设备还是输出设
备,分为输⼊缓冲区和输出缓冲区。
- 相当于,我是用户,操作系统是快递员,而菜鸟驿站就是缓冲区。我可以等我自己的事情做完了再去拿快递,这样就提高了效率。
1.代码举例
- 那么输出结果是什么呢?
- 发现上文的那些printf语句的内容并没有打印出来,但write语句的内容却被打印出来,为什么呢
- 因为write是系统调用,但printf是c语言函数库的函数,进程结束前,打印的内容一直存在语言缓冲区内,当进程结束时,想要把内容拷贝到文件内核缓冲区中发现fd已经被关掉了,所以无法拷贝
解决方法:
2.用户级缓冲区的刷新要求
存在如下三种:
- 强制刷新,例如fflush(stdout)
- 普通文件满足缓冲区满了就刷新一次,显示器文件则是每运行一行就刷新一次
- 进程结束,即代码运行完毕也会刷新一次
3.小提问
1.小提问(1)
- 结果输出什么:
- 那如何重定向到log.txt文件中呢?
- 发现“hello write”打印到了上面,因为之前打印的是显示器文件,遵守行刷新,log.txt是普通文件,采取满了才刷新的原则,这里是进程结束了,才触发了刷新,所以打印在hello write 后面。
2.小提问(2)
在屏幕上打印:
重定向到log.txt:
- 其中hellowrite 直接调用刷新,而后面的printf在进程结束前,一直在缓冲区内带着,创建进程,子进程拷贝了父进程的缓冲区,所以会打印两份