《Linux应用文件编程（二）

《Linux应用文件编程（二） — 标准IO》

1. 标准IO

　　与文件IO函数相类似，标准IO库中提供的是fopen、fclose、fread、fwrite等面向流对象的IO函数，这些函数在实现时本身就要调用linux的文件IO这些系统调用。

2. 标准IO的缓冲机制

　　由于IO设备的访问速度与CPU的速度相差好几个数量级，为了协调IO设备与CPU的速度的不匹配，对于块设备，内核使用了页高速缓存，即数据会先被拷贝到操作系统内核的页缓存区中，然后才会从操作系统内核的缓存区拷贝到应用程序的地址空间。

　　当应用程序尝试读取某块数据的时候，如果这块数据已经存放在页缓存中，那么这块数据就可以立即返回给应用程序，而不需要经过实际的物理读盘操作。当然，如果数据在应用程序读取之前并未被存放在页缓存中，那么就需要先将数据从磁盘读到页缓存中去。对于写操作来说，应用程序也会将数据先写到页缓存中去，数据是否被立即写到磁盘上去取决于应用程序所采用的写操作机制：如果用户采用的是同步写机制,那么数据会立即被写回到磁盘上，应用程序会一直等到数据被写完为止；如果用户采用的是延迟写机制，那么应用程序就完全不需要等到数据全部被写回到磁盘，数据只要被写到页缓存中去就可以了。在延迟写机制的情况下，操作系统会定期地将放在页缓存中的数据刷到磁盘上。与异步写机制不同的是，延迟写机制在数据完全写到磁盘上得时候不会通知应用程序，而异步写机制在数据完全写到磁盘上得时候是会返回给应用程序的。

　　标准IO提供三种类型的缓冲：

全缓冲：

　　填满标准IO缓冲区后才进行实际的IO操作。对于在磁盘上的文件通常由标准IO库实施全缓冲的。在一个流上执行第一次I/O操作时，相关标准I/O函数通常调用malloc获得需使用的缓存区。

行缓冲：

　　当在输入和输出中遇到换行符时，标准IO库执行IO操作。通常涉及到终端（例如标准输入和标准输出）使用的是行缓冲。

　　对于行缓冲有两个限制：

　　第一，因为标准IO库用来收集每一行的缓冲区的长度是固定的，所以只要填满了缓冲区，那么即使还没有写一个换行符，也进行IO操作。

　　第二，任何时候只要通过标准IO库要求从（a）一个不带缓存的流，或者（b）一个行缓存的流（它要求从内核得到数据）得到输入数据，那么就会造成冲洗所有行缓冲输出流（因为后面读取的数据可能就是前面输出的数据）。其实第二种情况我们会经常遇到，当我们先调用printf输出一串不带换行符的字符时，执行完这条printf语句并不会立刻在屏幕中显示我们输出的数据，当我们接下来调用scanf从标准输入读取数据时，我们才看到前面输出的数据。

不带缓冲：

　　标准IO库不对字符进行存储。例如，如果用标准IO函数fputs写15个字符到不带缓冲的流中，则该函数很可能直接调用write系统调用将这些字符立即写到相关的文件中。标准出错流stderr是不带缓冲的，这样为了让出错的信息可以尽快的显示出来。

3. 标准IO函数

3.1 fopen函数

#include <stdio.h>

FILE *fopen(const char *path, const char *mode);//mode为操作权限    //打开一个指定的文件
FILE *fdopen(int fd, const char *mode);                           //取一个现存的文件描述符，并使一个标准I/O流与该描述符相结合
FILE *freopen(const char *path, const char *mode, FILE *stream);  //用于重定向输入输出流的函数，将stream中的标准输入、输出、错误或者文件流重定向为filename文件中的内容。linux下需要重定向输出很容易使用 ./程序名 >test （>>test 追加）,windows下的输入输出重定向可以使用freopen。

返回值：
    成功返回一个FILE文件流指针，失败返回NULL，并且设置errno全局变量。

参数：
　　
    mode：
                r:以只读方式打开文件，该文件必须存在，返回的文件流指针位于文件开始
                r+ :以读/写方式打开文件，该文件必须存在，返回的文件流指针位于文件开始
                w:打开只写文件，若文件存在则文件长度清为零，即该文件内容会消失；若文件不存在则创建该文件
                w+:打开可读/写文件，若文件存在则文件长度清为零，即该文件内容会消失；若文件不存在则创建该文件
                a:以附加的方式打开只写文件。若文件不存在，则会创建该文件；如果文件存在，则写入的数据会被加到文件尾后，即文件原先的内容会被保留。
                a+:以附加方式打开可读/写的文件。若文件不存在，则会创建该文件，如果文件存在，则写入的数据会被加到文件尾后，即文件原先的内容会被保留。

　　　　　　　　　　r(read): 只读

　　　　　　　　　　w(write): 只写

　　　　　　　　　　a(append): 追加

　　　　　　　　　　t(text): 文本文件，可省略不写。例如r=rt。以打开一个文本文件

　　　　　　　　　　b(binary): 二进制文件

　　　　　　　　　　+: 读和写


　　stream: 文件指针，通常使用标准流文件(stdin/stdout/stderr)

　fdopen常用于由创建管道及网络通信通道函数返回的描述符（我们可能从 open，dup，dup2，fcntl，pipe，socket，socketpair或accept函数得到此文件描述符）。因为这些特殊类型的文件不能用fopen打开，因此必须先调用设备专用函数以获得一个文件描述符，然后再用fdopen使一个标准I/O流与该描述符相关联，形态必须和原先文件描述词读写模式相同。

　　对于fdopen函数，mode的参数稍有区别：1.因为该描述符已被打开，所以fdopen为写而打开并不截短该文件。2.不能用于创建文件（因为一个描述符引用一个文件，则该文件一定存在）。

例程：

fopen和fdopen函数

FILE *fp;
int fd;
if ((fp = fopen ("hello.txt", "w+")) == NULL)
    printf("fopen file error
");
    return 0;}
fprintf(fp , "hello word
");
fclose(fp);
if ((fd = open("hello.txt", O_RDWR )) == 1) {
    printf("open file fail
");
    return 0;}
if ((fp = fdopen( fd , "a+")) == NULL)
    printf("fdopen open
");
    return 0;
}
fprintf(fp , "linux c program");
fclose(fp);

freopen函数

freopen("test.in", "r", stdin);
程序的输入就会从标准输入流stdin转换到从文件"test.in"中输入。

freopen("test.out", "w", stdout);
程序的输出就会从原来的标准输出变成写入文件"test.out"中。

3.2 fread函数

#include <stdio.h>
size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

返回值：
   成功时fread返回的值与nmemb相等；若小于nmemb但是大于0，则可能是到了文件末尾，不够次数；若返回0，则是文件读取错误，不满一个size的大小。
　　所以循环读取文件的时候，while(可以判断是否大于等于0)作为条件，里面再基于feof函数判断是否到了文件末尾而退出循环。

参数：
    Ptr:读取的数据存储的位置
    Size:读取的每个单元的大小
    Nmemb：读取的单元数量
    Stream：从哪个文件流读取数据

　　fread不能区分到达文件尾和错误，因此必须使用feof和ferror函数确定是到达文件尾，还是发生错误。

例程：

int s[10];
 
if (fread(s, sizeof(int), 10, fp) < 0) {
     perror(“fread”);
     return  -1;
}

3.3 fwrite函数

#include <stdio.h>
size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

返回值：
    成功时fwrite返回的值与nmemb相等；若小于nmemb表示出错，可以用perror函数查看错误原因。

参数：
    prt:要写入的数据缓冲区
    size：每次写入的单元大小
    nmemb：写入的单元数
    stream：写入到哪个文件流

　例程1：

struct  student {
       int  no;
       char name[8];
       float  score;
 
} s[] = {{ 1, “zhang”, 97}, {2, “wang”, 95}};
 
fwrite(s, sizeof(struct student), 2, fp);

例程2：

write.c

#include <stdio.h>

#define PATH  "./1.txt"

typedef struct PEOPLE{
    char name[10];
    int age;
    char addr[10];
}PEOPLE;  //name和addr不能用指针形式，不然用fwrite的时候，用sizeof计算会有问题，导致写入后乱码

int main(void)
{
    FILE *fp;
    PEOPLE Myself;
    int len;

    Myself.age = 24;
    strcpy(Myself.name, "zhuangsan");
    strcpy(Myself.addr, "shenzhen");
        
    fp = fopen(PATH, "w");
    if(fp == NULL)
    {
        perror("fopen:");
　　　　 return 0;
    }
    //sizeof计算的是已用内存长度，如果是字符串指针，用strlen
    len = fwrite(&Myself, sizeof(struct PEOPLE), 1, fp);
    if(len < 1)
    {
        perror("fwrite:");
　　　　 return 0;
    }

    return 1;
}

read.c

#include <stdio.h>

typedef struct PEOPLE{
    char name[10];
    int age;
    char addr[10];
}PEOPLE;

#define PATH   "./1.txt"


int main(void)
{
    PEOPLE Myself;
    FILE *fp;
    int len;

    fp = fopen(PATH, "r");
    if(fp == NULL)
    {
        perror("fopen:");
　　　　 return 0;
    }

    len = fread(&Myself, sizeof(struct PEOPLE), 1, fp);
    if(len < 1)
    {
        perror("fread:");
　　　　 return 0;　
    }

    printf("name = %s 
",  Myself.name);
    printf("age = %d 
", Myself.age);
    printf("addr = %s 
", Myself.addr);
    
    return 1;
}

3.4 fclose函数

#include <stdio.h>

int fclose(FILE *fp);

返回值：
    成功返回0，刷新缓存，失败返回EOF，并且设置errno。

3.5 fseek函数

#include <stdio.h>

int fseek(FILE *stream, long offset, int whence);

返回值：
    重定位成功返回0，否则返回非零值

参数：
    stream：文件指针
    offset：指针的偏移量（该指针和文件指针不一样，该指针指的是文件内部数据）
    whence：指针偏移起始位置
        SEEK_SET  即0 文件开头
        SEEK_CUR 即1 文件当前位置
        SEEK_END 即2 文件结尾

fseek(fp,100,SEEK_SET);把fp指针移动到离文件开头100字节处
fseek(fp,100,SEEK_CUR);把fp指针移动到离文件当前位置100字节处
fseek(fp,100,SEEK_END);把fp指针退回到离文件结尾100字节处

　　fseek的作用：重定位文件内部的指针。

　　需要注意的是该函数不是重定位文件指针，而是重定位文件内部的指针，让指向文件内部数据的指针移到文件中我们感兴趣的数据上，重定位主要是这个目的。

　　说明：执行成功，则stream指向以whence为基准，偏移offset个字节的位置。执行失败(比方说offset偏移的位置超出了文件大小)，则保留原来stream的位置不变。

3.6 fflush函数

#include<stdio.h>

int fflush(FILE *stream);

参数:
    stream就是由fopen打开的文件流

　　fflush函数把文件流里的所有未写出的数据立即写出。调用fclose函数隐含执行了一次fflush操作，所以不必在调用fclose之前调用fflush。

3.7 fgetc、getc和getchar函数

#include<stdio.h>

int fgetc(FILE *stream);
int getc(FILE *stream);
int getchar();

　　fgetc函数从文件流里取出下一个字节并把它作为一个字符返回。当它到达文件尾或出现错误时返回EOF。

　　getc函数作用同fgetc一样。

　　getchar函数的作用相当于getc(stdin)，从标准输入里读取下一个字符。

fgetc和getc的区别：

　　fgetc是一个函数，而getc是一个宏。一般来说宏产生较大的代码，但是避免了函数调用的堆栈操作，所以速度会比较快。getc的参数不应当是具有副作用的表达式。宏都要避免用副作用表示式

　　1. 很多RISC处理器（如SUN SPARC）使用寄存器窗口重叠技术，（http://server.chinabyte.com/404/157904_1.shtml）
　　2.在寄存器充足的情况下，根本不需要堆栈操作，fgetc函数比getc宏更快
　　3. 在多线程的情况下，为了线程同步，getc和fgetc可能是相同的。

什么是副作用的表示式？

　　在这个程序中，z2我想算8*8，但是传入的参数是5+3,6+2,宏替换之后就变成了5+3*6+2，最后结果就成了25。

3.8 fputc、putc和putchar函数

#include<stdio.h>

int fputc(int c, FILE *stream);
int putc(int c, FILE *stream);
int putchar(int c);

　　fputc函数把一个字符写到输出文件流中。返回值是写入的值，失败返回EOF。

　　putc函数作用同fputc函数.

　　putchar函数相当于putc(c,stdout)，将字符c写到标准输出文件流中。

注意：即使fgetc和fputc这些的返回值和参数都是int的，但是读取和写入都是以字符来传递的。

3.9 fgets和gets函数

#include <stdio.h>

char *fgets(char *s, int n, FILE *stream);
char *gets(char *s);
参数：

str-- 这是指向一个字符数组的指针，该数组存储了要读取的字符串。
n-- 这是要读取的最大字符数（包括最后的空字符）。通常是使用以 str 传递的数组长度。
stream-- 这是指向 FILE 对象的指针，该 FILE 对象标识了要从中读取字符的流。

　　fgets函数把读到的字符写到s指向的字符串里，直到遇到换行符或者已经读取n-1个字符或者遇到文件尾。它会把遇到的换行符也传递到接收字符串里，再加上一个表示结尾的空字符尾0。

　　fgets成功完成时返回一个指向字符串s的指针，如果文件流已经到达文件尾，fgets会设置这个文件流的EOF标识并返回一个空指针。如果出现读错误，fgets返回一个空指针并设置errno。

　　与gets相比使用这个好处是：读取指定大小的数据，避免gets函数从stdin接收字符串而不检查它所复制的缓存的容积导致的缓存溢出问题。

　　gets函数从标准输入读取数据并丢弃遇到的换行符，并在接收字符串尾部加上一个null字节。警告：gets对传输字符的个数并没有限制，所以它可能会溢出自己的传输缓冲区，所以应该避免使用gets函数。
实例：

#include<string.h>
#include<stdio.h>
 
int main ( void )
{
    FILE*stream;
    char string[]="Thisisatest";
    char msg[20];

    stream=fopen("DUMMY.FIL","w+");

    fwrite(string,strlen(string),1,stream);

    fseek(stream,0,SEEK_SET);

    fgets(msg,strlen(string)+1,stream);

    printf("%s",msg);
    fclose(stream);
    return 0;
}

3.10 fputs和puts函数

#include <stdio.h>

int fputs(const char *str, FILE *stream);
int puts(const char *str);

参数：
    str：这是一个数组，包含了要写入的以空字符终止的字符序列
    stream：指向FILE对象的指针，该FILE对象标识了要被写入字符串的流
返回值：
    函数返回值为非负整数，否则返回EOF（符号常量，其值为-1）；
    成功写入一个字符串后，文件的位置指针会自动后移

　　fputs是一个函数，具有的功能是向指定的文件写入一个字符串（不自动写入字符串结束标记符‘’）。

　　puts()函数用来向标准输出设备（屏幕）输出字符串并换行，具体为：把字符串输出到标准输出设备，将''转换为回车换行。

fputs和puts的区别：

　　1.puts() 只能向标准输出流输出，而 fputs() 可以向任何流输出。

　　2.使用 puts() 时，系统会在自动在其后添加换行符；而使用 fputs() 时，系统不会自动添加换行符。

　　那么这是不是意味着使用 fputs() 时就要在后面添加一句“printf(" ")；”换行呢？看情况！如果输入时使用的是 gets()，那么就要添加 printf 换行；但如果输入时用的是 fgets()，则不需要。

　　因为使用 gets() 时，gets() 会将回车读取出来并丢弃，所以换行符不会像 scanf 那样被保留在缓冲区，也不会被 gets() 存储；而使用 fgets() 时，换行符会被 fgets() 读出来并存储在字符数组的最后，这样当这个字符数组被输出时换行符就会被输出并自动换行。

　　但是也有例外，比如使用 fgets() 时指定了读取的长度，如只读取 5 个字符，事实上它只能存储 4 个字符，因为最后还要留一个空间给 ''，而你却从键盘输入了多于 4 个字符，那么此时“敲”回车后换行符就不会被 fgets() 存储。数据都没有地方存放，哪有地方存放换行符呢！此时因为 fgets() 没有存储换行符，所以就不会换行了。

实例：

#include <stdio.h>
#include <conio.h>
int main(void)
{
    int i;
    char string[20];
    for(i=0;i<10;i++)
        string[i]='a';
    string[10]='';
    puts(string);
    getch();
    return 0;
}

　　puts输出字符串时要遇到'’也就是字符结束符才停止，如上面的程序加上一句 string[10]='';

3.11 printf、fprintf和sprintf函数

#include <stdio.h>

int printf(const char *format, ...);
int sprintf(const *s, const char *format, ...);
int fprintf(FILE *stream, const char *format, ...);

　　printf函数将输出送到标准输出流。
　　sprintf函数把输出加上一个结尾空字符送到字符串s中。
　　fprintf函数把输出输送到指定的文件流中。

　　format为输出格式类型，通常有以下几种常用的转换控制符:

3.12 scanf、fscanf和sscanf函数

#include<stdio.h>

int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *s，const char *format,. ...);

　　scanf系列函数使用一个格式字符串来控制输入数据的转化。
　　scanf函数从标准输入流中读入数据。fscanf函数从指定的文件流中读入数据。sscanf函数则从指定的字符串中读入数据。

　　format为输入格式类型，通常有以下几种常用的转换控制符:

　　用法：https://blog.csdn.net/respectableking/article/details/76478897

3.13 ftell函数、rewind函数

#include <stdio.h>

long ftell(FILE *stream);
void rewind(FILE *stream);

rewind()函数无返回值，fseek成功返回0，ftell成功返回当前偏移量，失败返回-1，并且设置errno。

4. 例程

例1：

#include <string.h>
#include <stdio.h>
int main(void)
{
   FILE *stream;
   char msg[] = "this is a test";
   char buf[20];
   if ((stream = fopen("DUMMY.FIL", "w+"))
       == NULL)
   {
      fprintf(stderr,"Cannot open output file.
");
      return 1;
   }
   /* write some data to the file */
   fwrite(msg, strlen(msg)+1, 1, stream);
   /* seek to the beginning of the file */
   fseek(stream, SEEK_SET, 0);
   /* read the data and display it */
   fread(buf, 1, strlen(msg)+1, stream);
   printf("%s
", buf);
   fclose(stream);
   return 0;
}

例2：

#include  <stdio.h>
#include  <stdlib.h>
int main(int argc,char *argv[])
{
    FILE *fp1, *fp2;       //流指针
    char buf[1024];        //缓冲区
    int n;      //存放fread和fwrite函数的返回值
    if(argc <=2)    //如果参数错误
    {
       printf("请输入正确的参数
!");   //参数错误
    }
    if ((fp1 = fopen(*(argv+1), "rb")) == NULL)
    //以只读方式打开源文件，读开始位置为文件开头
    {
         printf("读源文件%s发生错误
",*(argv+1));
         return 1;      //出错退出
      }
    if ((fp2 = fopen(*(argv+2), "wb")) == NULL)
    //以只写方式打开目标文件，写开始位置为文件结尾
    {
         printf("打开目标文件%s失败
",*(argv+2));
         return 2;       //出错退出
      }
   //开始复制文件，文件可能很大，缓冲一次装不下，所以使用一个循环进行读写*/
    while ((n = fread(buf, sizeof(char), 1024, fp1)) > 0)
    {
        //读源文件，直到将文件内容全部读完*/
        if (fwrite(buf, sizeof(char), n, fp2) == -1)
        {
            //将读出的内容全部写到目标文件中去
            printf("写如文件发生错误
");
            return 3;    /*出错退出*/
        }
    }
    printf("从源文件%s读数据写入目标文件%s中完成
",*(argv+1),*(argv+2)); //输出对应的提示
    if(n == -1)
    {
         //如果因为读入字节小于0而跳出循环，则说明出错了*/
         printf("读文件发生错误
");
         return 4;     /*出错退出*/
    }
    fclose(fp1);   /*操作完毕，关闭源文件和目标文件*/
    fclose(fp2);
    return 0;
}

关于换行符的一些：https://blog.csdn.net/weixin_44879687/article/details/89739899