通信模型socket

I/O的概念

操作系统的分为socket的I/O还有用户界面的输入输出，一般一个输入操作分为两个不同的阶段，1）等待数据准备好；2）从内核向进程复制数据

从理论上来讲，阻塞I/O、非阻塞I/O、复用I/O、信号驱动I/O都是同步IO模型，异步I/O就是异步IO，同步I/O向应用程序通知的是I/O就绪事件，异步I/O向应用程序通知的是I/O完成事件。

同步和异步：都是针对应用程序和操作系统之间交互而言的。同步的话，如果上层应用不主动询问操作系统的话，操作系统是不会主动通知应用程序的。异步的话，操作系统会主动通知应用程序。

阻塞：如果条件不满足的话，操作系统将应用程序挂起或者休眠，此时应用程序处于阻塞状态，只有当数据准备好之后或者数据已经从内核空间拷贝到用户空间，操作系统通知线程，此时唤醒线程。

非阻塞：如果条件不满足的话，该方法不会阻塞当前线程，而是立即返回一个标志信息（数据还没有准备好），或者timeou之后返回，此时应用线程还可以进行其他的操作。

在linux中并不存在真正的异步I/O，而是通过多路复用I/O的方式去模拟异步IO

注意：同步并不等同于阻塞，同步调用的时候，即便调用不返回，但是应用线程还处于运行状态，可以进行其他的操作，而阻塞调用时，应用线程处于阻塞状态。

操作系统5种通信模型

阻塞I/O

解释：应用程序会调用一个IO函数，导致应用程序阻塞，程序会一直停留在此处，如果数据准备好了，内核会将数据拷贝至应用程序

伪代码：

{     read(socket, buffer);     process(buffer); }

特点：当处理socket数量较少的时候，使用阻塞式I/O比较合适，当socket数量较大，为每一个socket都分配一个读线程、处理线程以及同步的事件，那么对操作系统的开销会变得很大，并且不支持大数据量的socket链接

非阻塞I/O

解释：非阻塞IO就是通过反复调用IO函数，如果没有数据，那么会立即返回一个错误的接口，不断去调用，不断去轮询，查看是否可以获取数据，通常来说，这种比较耗费大量的cpu时间，在数据拷贝阶段，还是阻塞的，原理就是应用程序在socket非阻塞的时候，告诉操作系统，不要在没有数据的时候把我挂起或者休眠，而是返回一个错误的信号

伪代码：

{     while(read(socket, buffer) != SUCCESS)     ;     process(buffer); }

特点：不容易使用，需要编写更多的代码，如果非阻塞IO在控制建立多个连接，在数据的收发量不均，时间不定的情况下，更具优势

I/O复用模型

解释：主要就是select、poll和epoll，有了I/O复用，我们可以使用select或者poll或者epoll，两次调用，两次返回，相对于阻塞I/O没有什么优越性，关键是能实现同时对多个IO端口进行监听，会使进程阻塞，可以同时阻塞多个I/O操作。

多路复用I/O模型是目前使用比较多的模型，所谓多路复用，可以理解为在一个应用线程里面可以处理多个socket连接，或者同一个端口接受来自多个客户端的请求（连接、读、写），多路复用I/O与传统的非阻塞IO的区别在于，在传统的非阻塞I/O中，是由用户去轮询socket状态，而在多路复用I/O中，由内核去轮询向select注册的socket的状态，所以多路复用IO需要操作系统的支持。

最大的优势是，在同一个线程中，可以同时处理多个socket的IO请求，在同步阻塞模型中，必须通过多线程的方式才可以达到这个目的。while循环之前，将socket添加到select监视中，然后while循环一直调用select获取被激活的socket，一旦socket可读，便调用read函数将socket中的数据读取出来。但是每个IO请求的过程还是阻塞的（在select函数上阻塞），平均时间甚至比同步阻塞IO模型还要长。

伪代码：

{     select(socket);     while(true){         sockets = select();         for(socket in sockets){             if(can_read(socket)){                 read(socket, buffer);                 process(buffer);             }         }     } }

特点：使用场景：

1）当客户处理多个描述符（通常是交互式输入和socket）时，必须使用I/O复用

2）一个客户同时处理多个socket是可能的

3）如果一个TCP服务器既要处理监听socket，又要处理已经连接的socket，一般就要使用I/O复用

4）如果一个服务器既要处理TCP，又要处理UDP，一般就要使用I/O复用

信号驱动I/O

解释：首先我们允许socket进行信号驱动I/O，并且安装一个信号处理函数，进行继续运行不阻塞，当数据准备好之后，进程收到一个SIGIO信号，可以在信号处理函数中调用I/O操作函数处理数据

特点：这种模型的优势在于等待数据包到达期间，进程不会被阻塞，只需要等待信号处理函数的通知，既可以是数据准备好被处理，也可以是数据包已经准备好被读取

异步I/O模型

解释：先异步调用，但是不会立即返回数据，而是等待被调用部件完成后，通过状态、通知和回调来通知调用者的输入输出操作，这个与信号驱动I/O的区别在于：1）信号驱动I/O是由内核通知我们如何启动一个I/O操作；2）而异步I/O模型是由内核通知我们I/O操作何时完成，异步I/O模型才是最理想的I/O模型，在异步I/O模型中，当用户线程发起read操作之后，立刻就可以开始去做其他的事情。而另外一方面，从内核的角度，当它收到asynchronous read之后，它会立刻返回，说明read请求已经成功发起，因此不会对用户线程产生任何block。然后内核会等待数据准备完成，然后将数据拷贝到用户线程，当这一切都完成之后，内核就会给用户线程发一个信号，告诉它read操作完成了。也就说用户线程完全不需要实际的整个I/O操作是如何进行的，只需要先发起一个请求，当接受内核返回成功的信号时表示I/O操作已经完成，可以直接去使用数据了，异步I/O模型中，由操作系统内核去等待数据就绪，copy数据到用户空间，用户线程始终没有阻塞。

特点：我们调用aio_read函数，给内核传递描述符、缓冲区指针，缓冲区大小和文件偏移，并告诉内核当整个操作完成的时候如何通知我们。该系统调用后就立即返回，而且在等待I/O完成期间，我们的进程不被阻塞

参考资料：

https://blog.csdn.net/z137657747/article/details/78515117

https://www.cnblogs.com/wuchanming/p/4442146.html

https://blog.csdn.net/king866/article/details/53870086

https://www.cnblogs.com/god-of-death/p/7837695.html

https://www.cnblogs.com/jeakeven/p/5435916.html