10.1 C文件的有关基本知识
10.1.1 什么是文件
文件有不同的类型,在程序设计中,主要用到两种文件:
(1) 程序文件。包括源程序文件(后缀为.c)、目标文件(后缀为.obj)、可执行文件(后缀为.exe)等。这种文件的内容是程序代码。 |
(2) 数据文件。文件的内容不是程序,而是供程序运行时读写的数据,如在程序运行过程中输出到磁盘(或其他外部设备)的数据,或在程序运行过程中供读入的数据。如一批学生的成绩数据、货物交易的数据等。 |
说明: 为了简化用户对输入输出设备的操作,使用户不必去区分各种输入输出设备之间的区别,操作系统把各种设备都统一作为文件来处理。从操作系统的角度看,每一个与主机相连的输入输出设备都看作一个文件。例如,终端键盘是输入文件,显示屏和打印机是输出文件。 |
文件(file)一般指存储在外部介质上数据的集合。操作系统是以文件为单位对数据进行管理的。
输入输出是数据传送的过程,数据如流水一样从一处流向另一处,因此常将输入输出形象地称为流(stream),即数据流。
流表示了信息从源到目的端的流动。在输入操作时,数据从文件流向计算机内存,在输出操作时,数据从计算机流向文件(如打印机、磁盘文件)。
C的数据文件由一连串的字符(或字节)组成,而不考虑行的界限,两行数据间不会自动加分隔符,对文件的存取是以字符(字节)为单位的。输入输出数据流的开始和结束仅受程序控制而不受物理符号(如回车换行符)控制,这就增加了处理的灵活性。这种文件称为流式文件。
10.1.2 文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件标识包括3部分: (1)文件路径; (2)文件名主干; (3)文件后缀。
(1) 文件路径表示文件在外部存储设备中的位置 |
(2) 文件名主干的命名规则遵循标识符的命名规则 |
(3) 文件后缀用来表示文件的性质 |
常见的后缀有:mp3 mp4 docx pptx jpg png 等
为方便起见,文件标识常被称为文件名,但应了解此时所称的文件名,实际上包括以上3部分内容,而不仅是文件名主干。
根据数据的组织形式,数据文件可分为ASCII文件和二进制文件。
说明: 数据在内存中是以二进制形式存储的,如果不加转换地输出到外存,就是二进制文件,可以认为它就是存储在内存的数据的映像,所以也称之为映像文件(image file)。如果要求在外存上以ASCII代码形式存储,则需要在存储前进行转换。ASCII文件又称文本文件(text file),每一个字节存放一个字符的ASCII代码。 |
既可以用ASCII形式存储,也可以用二进制形式存储。
说明: 用ASCII码形式输出时字节与字符一 一对应,一个字节代表一个字符,因而便于对字符进行逐个处理,也便于输出字符。但一般占存储空间较多,而且要花费转换时间(二进制形式与ASCII码间的转换)。用二进制形式输出数值,可以节省外存空间和转换时间,把内存中的存储单元中的内容原封不动地输出到磁盘(或其他外部介质)上,此时每一个字节并不一定代表一个字符。 |
简单来说,就是如果使用ASCII码需要进行转换,而使用二进制则不需要转换。
10.1.4 文件缓冲区
ANSI C标准采用“缓冲文件系统”处理数据文件,所谓缓冲文件系统是指系统自动地在内存区为程序中每一个正在使用的文件开辟一个文件缓冲区。
解释: 从内存向磁盘输出数据必须先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘去。如果从磁盘向计算机读入数据,则一次从磁盘文件将一批数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(给程序变量)。这样做是为了节省存取时间,提高效率,缓冲区的大小由各个具体的C编译系统确定。 |
说明: 每一个文件在内存中只有一个缓冲区,在向文件输出数据时,它就作为输出缓冲区,在从文件输入数据时,它就作为输入缓冲区。 |
简单来说,就是程序运行为了节省存取时间,提高效率,则我们就需要使用到缓冲区。
10.1.5 文件类型指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
说明: 每个被使用的文件都在内存中开辟一个相应的文件信息区,用来存放文件的有关信息(如文件的名字、文件状态及文件当前位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名为FILE。 |
一种C编译环境提供的stdio.h头文件中有以下的文件类型声明:
typedef struct { short level; //缓冲区“满”或“空”的程度 unsigned flags; //文件状态标志 char fd; //文件描述符 unsigned char hold; //如缓冲区无内容不读取字符 short bsize; //缓冲区的大小 unsigned char*buffer; //数据缓冲区的位置 unsigned char*curp; //文件位置标记指针当前的指向 unsigned istemp; //临时文件指示器 short token; //用于有效性检查 }FILE; |
FILE *fp; //定义一个指向FILE类型数据的指针变量 |
解释: 可以使fp指向某一个文件的文件信息区(是一个结构体变量),通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。如果有n个文件,应设n个指针变量,分别指向n个FILE类型变量,以实现对n个文件的访问。为方便起见,通常将这种指向文件信息区的指针变量简称为指向文件的指针变量。 |
注:指向文件的指针变量并不是指向外部介质上的数据文件的开头,而是指向内存中的文件信息区的开头。
10.2 打开与关闭文件
对文件读写之前应该“打开(Open)”该文件,在使用结束之后应“关闭(Close)”该文件。
说明: “打开”是指为文件建立相应的信息区(用来存放有关文件的信息)和文件缓冲区(用来暂时存放输入输出的数据)。在编写程序时,在打开文件的同时,一般都指定一个指针变量指向该文件,也就是建立起指针变量与文件之间的联系,这样,就可以通过该指针变量对文件进行读写了。 |
“关闭”是指撤销文件信息区和文件缓冲区,使文件指针变量不再指向该文件,显然就无法进行对文件的读写了。 |
10.2.1 用fopen函数打开数据文件
ANSI C规定了用标准输入输出函数fopen来实现打开文件。
Open函数的调用方式为
fopen(文件名,使用文件方式); |
[例] fopen使用示例
FILE*fp; //定义一个指向文件的指针变量fp fp=fopen(″a1″,″r″); //将fopen函数的返回值赋给指针变量fp,表示以“读入”方式打开名字为a1的文件 |
在打开一个文件时,通知编译系统以下3个信息: ① 需要打开文件的名字,也就是准备访问的文件的名字 ② 使用文件的方式(“读”还是“写”等) ③ 让哪一个指针变量指向被打开的文件 |
使用文件方式有如下形式:
说明:
(1) 用“r”方式打开的文件只能用于向计算机输入而不能用作向该文件输出数据,而且该文件应该已经存在,并存有数据,这样程序才能从文件中读数据。不能用“r”方式打开一个并不存在的文件,否则出错。 |
(2) 用“w”方式打开的文件只能用于向该文件写数据(即输出文件),而不能用来向计算机输入。如果原来不存在该文件,则在打开文件前新建立一个以指定的名字命名的文件。如果原来已存在一个以该文件名命名的文件,则在打开文件前先将该文件删去,然后重新建立一个新文件。 |
(3) 如果希望向文件末尾添加新的数据(不希望删除原有数据),则应该用“a”方式打开。但此时应保证该文件已存在;否则将得到出错信息。在每个数据文件中自动设置了一个隐式的“文件读写位置标记”,它指向的位置就是当前进行读写的位置。如果“文件读写位置标记”在文件开头,则下一次的读写就是文件开头的数据。然后“文件读写位置标记”自动移到下一个读写位置,以便读写下一个数据。以添加方式打开文件时,文件读写位置标记移到文件末尾。 |
(4) 用“r+”“w+”“a+”方式打开的文件既可用来输入数据,也可用来输出数据。 |
(5) 如果不能实现“打开”的任务,fopen函数将会带回一个空指针值NULL。 |
(6) C标准建议用表10.1列出的文件使用方式打开文本文件或二进制文件,但目前使用的有些C编译系统可能不完全提供所有这些功能,需要注意所用系统的规定。 |
(8) 如果用“wb”的文件使用方式,并不意味着在文件输出时把内存中按ASCII形式保存的数据自动转换成二进制形式存储。输出的数据形式是由程序中采用什么读写语句决定的。例如,用fscanf和fprintf函数是按ASCII方式进行输入输出,而fread和fwrite函数是按二进制进行输入输出。 |
(9) 程序中可以使用3个标准的流文件——标准输入流、标准输出流和标准出错输出流。系统已对这3个文件指定了与终端的对应关系。标准输入流是从终端的输入,标准输出流是向终端的输出,标准出错输出流是当程序出错时将出错信息发送到终端。程序开始运行时系统自动打开这3个标准流文件。 |
注意:我们推荐使用以下方式打开文件
//打开一个文件的常用方法 if ((fp=fopen(″file1″,″r″))==NULL) { printf(″cannot open this file ″); exit(0); } |
10.2.2 用fclose函数关闭数据文件
在使用完一个文件后应该关闭它,以防止它再被误用。
解释: “关闭”就是撤销文件信息区和文件缓冲区,使文件指针变量不再指向该文件,也就是文件指针变量与文件“脱钩”,此后不能再通过该指针对原来与其相联系的文件进行读写操作,除非再次打开,使该指针变量重新指向该文件。 |
如果不关闭文件就结束程序运行将会丢失数据。
说明: 在向文件写数据时,是先将数据输出到缓冲区,待缓冲区充满后才正式输出给文件。如果当数据未充满缓冲区时程序结束运行,就有可能使缓冲区中的数据丢失。用fclose函数关闭文件时,先把缓冲区中的数据输出到磁盘文件,然后才撤销文件信息区。有的编译系统在程序结朿前会自动先将缓冲区中的数据写到文件,从而避免了这个问题,但还是应当养成在程序终止之前关闭所有文件的习惯。 |
关闭文件用fclose函数。fclose函数调用的一般形式为:
fclose(文件指针);
如:fclose(fp);
注:fclose函数也带回一个值,当成功地执行了关闭操作,则返回值为0;否则返回EOF(-1)。
10.3 顺序读写数据文件
10.3.1 怎样向文件读写字符
读写一个字符的函数:
函数名 |
调用形式 |
功能 |
返回值 |
fgetc |
fgetc(fp) |
从fp指向的文件读入一个字符 |
读成功,带回所读的字符,失败则返回文件结束标志EOF(即-1) |
fputc |
fputc(ch,fp) |
把字符ch写到文件指针变量fp所指向的文件中 |
输出成功,返回值就是输出的字符;输出失败,则返回EOF(即-1) |
说明:
fgetc的第1个字母f代表文件(file),中间的get表示“获取”,最后一个字母c表示字符(character),fgetc的含义很清楚: 从文件读取一个字符。fputc也类似。 |
[例] 从键盘输入一些字符,并逐个把它们送到磁盘上去,直到用户输入一个“#”为止。
#include <stdio.h> #include <stdlib.h> int main() { FILE *fp; //定义文件指针fp char ch,filename[10]; printf("请输入所用的文件名: "); scanf("%s",filename); //输入文件名 getchar(); //用来消化最后输入的回车符 if((fp=fopen(filename,"w"))==NULL) //打开输出文件并使fp指向此文件 { printf("cannot open file "); //如果打开出错就输出“打不开” exit(0); //终止程序 } printf("请输入一个准备存储到磁盘的字符串(以#结束): "); ch=getchar(); //接收从键盘输入的第一个字符 while(ch!='#') //当输入′#′时结束循环 { fputc(ch,fp); //向磁盘文件输出一个字符 putchar(ch); //将输出的字符显示在屏幕上 ch=getchar(); //再接收从键盘输入的一个字符 } fclose(fp); //关闭文件 putchar(10); //向屏幕输出一个换行符 return 0; } |
说明: 用来存储数据的文件名可以在fopen函数中直接写成字符串常量形式 ,也可以在程序运行时由用户临时指定。 用fopen函数打开一个“只写”的文件(“w”表示只能写入不能从中读数据),若成功,函数返回该文件所建立的信息区的起始地址给文件指针变量fp。若失败,则显示“无法打开此文件”,用exit函数终止程序运行,此函数在stdlib.h头文件中。 用getchar函数接收用户从键盘输入的字符。注意每次只能接收一个字符。 |
运行结果:
[例] 将一个磁盘文件中的信息复制到另一个磁盘文件中。今要求将上例建立的file1.dat文件中的内容复制到另一个磁盘文件file2.dat中。
#include <stdio.h> #include <stdlib.h> int main() { FILE *in,*out; //定义指向FILE类型文件的指针变量 char ch,infile[10],outfile[10]; //定义两个字符数组,分别存放两个数据文件名 printf("输入读入文件的名字:"); scanf("%s",infile); //输入一个输入文件的名字 printf("输入输出文件的名字:"); scanf("%s",outfile); //输入一个输出文件的名字 if((in=fopen(infile,"r"))==NULL) //打开输入文件 { printf("无法打开此文件 "); exit(0); } if((out=fopen(outfile,"w"))==NULL) //打开输出文件 { printf("无法打开此文件 "); exit(0); } ch=fgetc(in); //从输入文件读入一个字符,赋给变量ch while(!feof(in)) //如果未遇到输入文件的结束标志 { fputc(ch,out); //将ch写到输出文件 putchar(ch); //将ch显示到屏幕上 ch=fgetc(in); //再从输入文件读入一个字符,赋给变量ch } putchar(10); //显示完全部字符后换行 fclose(in); //关闭输入文件 fclose(out); //关闭输出文件 return 0; } |
说明: 在访问磁盘文件时,是逐个字符(字节)进行的,为了知道当前访问到第几个字节,系统用“文件读写位置标记”来表示当前所访问的位置。开始时“文件读写位置标记”指向第1个字节,每访问完一个字节后,当前读写位置就指向下一个字节,即当前读写位置自动后移。 为了知道对文件的读写是否完成,只须看文件读写位置是否移到文件的末尾。 |
运行结果:
10.3.2 怎样向文件读写一个字符串
读写一个字符串的函数:
函数名 |
调用形式 |
功能 |
返回值 |
fgets |
fgets(str,n,fp) |
从fp指向的文件读入一个长度为(n-1)的字符串,存放到字符数组str中 |
读成功,返回地址str,失败则返回NULL |
fputs |
fputs(str,fp) |
把str所指向的字符串写到文件指针变量fp所指向的文件中 |
输出成功,返回0;否则返回非0值 |
说明:
fgets中最后一个字母s表示字符串(string)。见名知义,fgets的含义是: 从文件读取一个字符串。 |
fgets函数的函数原型为:
char *fgets(char*str, int n, FILE*fp); |
其作用是从文件读入一个字符串。调用时可以写成下面的形式:
fgets(str,n,fp); |
解释: 其中,n是要求得到的字符个数,但实际上只从fp所指向的文件中读入n-1个字符,然后在最后加一个′ |