程序员成长之旅——文件操作

什么是文件

磁盘上的文件就是文件。
但是在程序设计中,我们谈的文件一般有两种:程序文件 数据文件

程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

这里和大家主要探讨一下数据文件。

文件名

文件名包含3部分:文件路径+文件名主干+文件后缀
例如:C:\windows\test.c
一个文件要有唯一的文件标识,文件标识也叫文件名。

文件类型

根据数据的组织形式,数据文件被称为文本文件或者二进制文件
二进制文件:

数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。

文本文件:

如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。

一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int main()
{
	int a = 10000;
	FILE* pf = fopen("test.txt", "wb");
	fwrite(&a, 4, 1, pf);
	fclose(pf);
	pf = NULL;
	return 0;
}

在这里插入图片描述

文件缓冲区

ANSIC 标准采用缓冲文件系统处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块文件缓冲区。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。
缓冲区大小根据C编译系统决定。

文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.
例如,VS2008编译环境提供的 stdio.h 头文件中有以下的文件类型申明:

struct _iobuf {
        char *_ptr;
        int   _cnt;
        char *_base;
        int   _flag;
        int   _file;
        int   _charbuf;
        int   _bufsiz;
        char *_tmpfname;
       };
typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:

FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件

文件的打开与关闭

通俗理解,我们就可以知道,文件是在读写之前应该先打开文件,在使用结束之后应该关闭文件

在编写程序的时候,再打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

ANSIC规定使用fopen函数来打开文件,flcose来关闭文件。

FILE* fopen(const char* filename,const char* mode);
int flcose(FILE* stream)

实例代码:

#include<stdio.h>
int main()
int main()
{
	FILE* pFile;
	pFile = fopen("myfile.txt","w");
	if(pFile != NULL)
	{
		fputs("fopen example",pFile);
		fclose(pFile);
	}
	return 0;
}

文件的顺序读写

功能 函数名 适用于
字符输入函数 fgetc 所有输入流
字符输出函数 fputc 所有输出流
文本行输入函数 fgets 所有输入流
文本行输出函数 fputs 所有输出流
格式化输入函数 fscanf 所有输入流
格式化输出函数 fprintf 所有输出流
二进制输入 fread 文件
二进制输出 fwrite 文件

对比一组函数
1.scanf和printf

scanf针对标准输入流的格式化输入函数
printf针对标准输出流的格式化输出函数

int scanf ( __const char *__restrict __format , ...) __wur,  其中 ... 是变长的变量参数. 例如: scanf("%d  %f",&i,&f) 表示将标准输入输入的参数赋值给变量i和f。
int printf ( __const char *__restrict __format , ...) ,例如:printf("%d",i)表示将变量i的值到标准输出。

2.fscanf和fprintf

fscanf针对所有输入流的格式化输入函数
fprintf针对所有输出流的格式化输出函数

int fscanf (FILE *__restrict __stream, __const char *__restrict __format, ...) __wur,例如 fscanf(fp,"%d  %f",&i,&f) 表示将文件指针代表的当前数据,往往是一行输出到变量i和f。
int fprintf (FILE *__restrict __stream, __const char *__restrict __format, ...),例如 fprintf(fp,"%d %f",i,f);

3.sscanf和sprintf

sscanf 从 字符串 中接受输入,将数据以指定格式输出到变量,常用做 将字符串转化为其它变量。
sprintf 将变量以指定格式输出到字符串,常用作 将其它类型的变量转化为字符串。

int sscanf (__const char *__restrict __s, __const char *__restrict __format, ...) __THROW, 例如 sscanf(p,"%d",&i) 表示将p表示的字符串转化为整型变量,并赋值给i,若指针 p 指向的字符串是"12345",则 i = 12345int sprintf (char *__restrict __s, __const char *__restrict __format, ...) __THROW,例如 sprintf(p,"%d",i),若 i =12345,则指针p指向的内存存储的是字符串"12345".

文件的随机读写

fseek

根据文件指针的偏移量来定位文件指针

int fseek(FILE* stream,long int offset,int origin);

ftell

返回文件指针相对于起始位置的偏移量

long int ftell ( FILE * stream );

fseek

让文件指针的位置回到文件的起始位置

void rewind(FILE* stream);

文件结束判定

被错误使用的feof
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件是否结束。
而是应用于文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。

  1. 文本文件读取是否结束,判断返回值是否为EOF (fgetc),或者NULL(fgets)
    例如:
    • fgetc判断是否为EOF.
    • fgets判断返回值是否为NULL.
  2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
    例如:
    • fread判断返回值是否小于实际要读的个数
发布了76 篇原创文章 · 获赞 16 · 访问量 4424

猜你喜欢

转载自blog.csdn.net/wuweiwuju___/article/details/100046681
今日推荐