Linux编程基础——文件读写

缓冲I/O和非缓冲I/O

文件读写主要牵涉到了如下五个操作：打开、关闭、读、写、定位。在Linux系统中，提供了两套API，一套是C标准API：fopen、fclose、fread、fwrite、fseek，另一套则是POSIX定义的系统API：open、close、read、write、seek。

其中POSIX定义的API是系统API，而C标准API是基于系统API的封装，并且提供了额外的缓冲的功能。因此也可以把它们叫做缓冲I/O函数和非缓冲I/O函数。

除了前面介绍的这几个缓冲IO函数外，C标准库<stdio.h>里面还提供了一系列封装的IO函数：如puts、putchar、printf等。

为什么要有增加缓冲区这个功能呢？主要是因为IO操作时，操作系统要从用户态转换为内核态的，而这个转换过程相对来说比较慢，因此可以通过缓冲的形式减少转换到内核态的次数。那么，缓冲IO函数又是如何工作的呢？

当用fopen打开文件时，除了分配文件句柄外，还额外申请了一个缓冲区。
读文件时，会首先读到缓冲区中，然后返回用户需要的部分，多余的部分仍然放在缓冲区，下次再读的时候可以直接从缓冲区中返回。
写文件时，会先写到缓冲区中，等缓冲区满后再统一写到文件中。

那么，我们该如何选择哪一组I/O函数呢？

非缓冲I/O函数每次读写都要进内核，调一个系统调用比调一个用户空间的函数要慢很多，所以在用户空间开辟I/O缓冲区还是必要的。

用缓冲I/O库函数要时刻注意I/O缓冲区和实际文件有可能不一致，在必要时需调用fflush()。
I/O函数也用于读写设备，比如终端或网络设备。此时通常需要更快的响应，一般不使用缓冲I/O函数。

PS：严格来讲，就算是POSIX的I/O函数，仍然是有内核I/O缓冲的，所以write也不一定是直接写到文件的，也可能写到内核I/O缓冲区中，至于究竟写到了文件中还是内核缓冲区中对于进程来说是没有太大差别的，我们不用太关注这一点。

阻塞I/O和非阻塞I/O

文件读写通常有阻塞和非阻塞两种方式，其中阻塞方式是我们比较常见的一种方式，此时函数会阻塞至操作完成。例如，对于如下一个等待用户输入字符串，并在屏幕上输出的例子：

    #include <unistd.h>
    #include <stdlib.h>

    int main(void)
    {
        char buf[10];
        int n = read(STDIN_FILENO, buf, 10);
        write(STDOUT_FILENO, buf, n);
        return 0;
    }

执行该函数时，read函数会一直阻塞到在屏幕上输入数据并回车（此时STDIN有数据可用）为止。

阻塞IO有一个很大的问题是：无法实现并发。当同时进行多个IO操作的时候，前面的文件数据不可用的时候（往往是Socket之类的IPC操作），后面的IO操作无法执行。

非阻塞IO则可以很好的解决这个问题，要使用非阻塞IO操作，需要在open的时候制定O_NONBLOCK标志。这样，如果设备暂时没有数据可读就返回-1，调用者应该试着再读一次（again）。这种行为方式称为轮询（Poll），调用者只是查询一下，而不是阻塞在这里死等，这样可以同时监视多个设备：

    #include <unistd.h>
    #include <fcntl.h>
    #include <stdlib.h>

    int main(void)
    {
        char buf[10];
        int fd, n;

        fd = open("/dev/tty", O_RDONLY|O_NONBLOCK);

        while (1)
        {
            n = read(fd, buf, 10);
            if (n >= 0)
                break;

            sleep(1);
        }

        write(STDOUT_FILENO, buf, n);
        close(fd);
        return 0;
    }

PS：为了示例函数简单，我这里没有考虑异常情况（如open失败）的处理，而这些是在实际项目中是必不可少的。

非阻塞I/O有一个缺点，如果所有设备都一直没有数据到达，调用者则需要反复查询，这样会一直占着cpu不放。因此，在使用非阻塞I/O时，通常不会在一个while循环中一直不停地查询（这称为Tight Loop），而是每延迟等待一会儿来查询一下，以免做太多无用功，在延迟等待的时候可以调度其它进程执行。

但是，这样又引入了一个新的问题，可能导致数据读取的不够及时，就拿我前面的例子来说，我在每次循环的时候Sleep了一秒。如果刚开始Sleep的时候数据可用，但此时却无法立即响应，需要到Sleep结束后钟才能输出结果。

要解圆满解决这个问题，则需要用到select函数，它可以阻塞地同时监视多个设备，还可以设定阻塞等待的超时时间，由于select多见于socket编程场景，这里不大好举例，后续如果会介绍socket编程的时候再详细介绍它，要了解它的工作原理可以看一下这篇文章select，多路同步I/O模型。