玩转BIO,NIO,AIO模型, 阻塞 同步 与IO多路复用

1.啥是IO?

2.讲明白同步和阻塞俩概念

3.啥是IO多路复用,操作系统层的演进

4.对比BIO,NIO,AIO

四步玩转IO模型

1.啥是IO

计算机核心三大功能:   Input   计算   OutPut

IO重要吧 没有IO计算机就是玩具 

那IO又可分为几种 常用的,磁盘IO  网络IO  

闭眼睛想 如果IO不给力,计算机运算能力再牛逼 会不会影响整体效率的,非常影响

从底层磁盘看IO:  啥是磁盘IO

2. 同步与阻塞

同步与异步,指的是API,接口,服务调用等层面的概念。

同步指的是一步一步来,上一步执行完 返回结果 才能执行下一步, 异步指的是 不需要等上一步执行完返回结果,就能执行下一步。

举个简单的例子就是 java线程池, 把具体的任务丢到线程池里就不管了,主线程可以继续干别的事了,不需要阻塞在那等任务执行完,线程池主要的目的也是为了完成异步。

通常异步的执行可以通过回调接口来获取执行结果,如FutureTask,可以获取到异步执行的情况

阻塞与非阻塞,指的是底层操作系统IO层面的概念。

阻塞指的是 进程调用操作系统执行IO,IO执行完成之前,进程会一直阻塞在那等待,直到IO完成获取到返回结果

非阻塞指的是 进程调用操作系统执行IO,IO没有完成会直接返回失败结果,进程循环去调用直到IO完成,或者IO完成后操作系统回调接口来通知进程拿数据。总而言之 进程不需要在那一动不动的阻塞住等IO  这就是非阻塞。

现在区别开同步和阻塞,一个是应用接口调用层面,一个是底层操作系统IO层面,两者的思想很相近

3.啥是IO多路复用,操作系统层的演进

模拟一个场景:

我们这台机器作为服务端,另一台机器作为客户端

客户端请求创建一次网络连接,随后通过网络传输数据

此时在我们机器读取数据过程

我们创建一个线程,用来监听新创建的Socket,读取发来的数据

阻塞式IO:

线程调用read函数,如果没有数据发来 就一直阻塞,

数据从网卡传到内核态,内核缓冲区复制到用户缓冲区,传输过程中线程保持阻塞状态, 直到拿到数据返回结果

非阻塞IO:

不用等数据传输完,即可返回给线程一个结果(-1 或失败), 这样可以放开线程去干别的事,

需要用户线程循环调用 read,直到返回值不为 -1,再开始处理业务。

但是这样有个明显的缺点    线程想拿到数据 就得不断一遍一遍调用,一遍一遍询问数据传好了没有, 也会有不小的开销,

多线程并发执行的情况下 每一个Socke监听都会耗着一个线程,消耗线程资源

IO多路复用 select:

不再为每一次Socket监听创建一个线程了,而是一个线程同时服务多个Socket套接字

在用户态,每创建一个套接字 添加一个文件描述符fd 到数组里

用户态将fd数组拷贝到内核态,执行select函数

select函数 让内核去遍历数组中的每个元素,执行非阻塞的判断,判断是否Socket准备好数据了

最后select返回准备好的fd个数,通知用户态

用户态执行read函数去读数据

优点:

由内核态做遍历,有效的减少了每次遍历判断要经过用户态 内核态之间切换 !!

问题:

1.select返回结果只是fd个数,具体哪个fd准备好了还要用户态自己遍历 !!

2.select需要拷贝fd数组到内核态,高并发场景下消耗较大

3.select在遍历的过程中也是阻塞的,用户态需要阻塞的等待内核态返回结果

IO多路复用 poll:

poll只是在select基础上增强,它和 select 的主要区别就是,去掉了 select 只能监听 1024 个文件描述符的限制。

IO多路复用 epoll:

1. 内核中保存一份文件描述符集合,无需用户每次都重新传入,只需告诉内核修改的部分即可。

2. 内核不再通过轮询的方式找到就绪的文件描述符,而是通过异步 IO 事件唤醒。

3. 内核仅会将有 IO 事件的文件描述符返回给用户,用户也无需遍历整个文件描述符集合。

总结一下 整个过程,

IO多路复用解决的问题是,我的服务端同时和十个客户端建立连接 等着客户端发数据,那我怎么随时随地直到哪个客户端发数据了 我好读数据呢?

原始办法就是每一个连接 创建一个线程阻塞的等待客户端消息,这显然不够友好

IO多路复用就通过一个线程同时监听十个客户端,轮训着客户端套接字 哪个好了通知我读哪个不就好了。

如果轮训遍历是在用户态完成的,每一次判断数据准备好都要用户态切内核态,内核态切用户态 这样是不是效率很低?

索性把是个客户端代表的文件描述符传到内核态,让内核态去遍历,遍历出结果再告诉用户态就完了呗。

最后的read读数据 还是要用户态去读。只不过是有确定的去读

4.对比BIO,NIO与AIO

BIO: 也称同步阻塞IO,顾名思义 应用调用层是同步的,操作系统层是阻塞的。 可以参考java InputStream流,当read磁盘数据时,read()方法会阻塞在那,而底层也会阻塞在那等待IO完成 

NIO: 也称同步非阻塞IO,应用调用层是同步的,操作系统层是非阻塞的。 如果基于NIO进行网络通信,采取的就是多路复用的IO模型,这个多路复用IO模型针对的是网络通信中的IO场景来说的。

AIO: 也成异步非阻塞IO,也叫做NIO2.0 异步IO模型,应用调用层是异步的,操作系统层是非阻塞的。应用层调用不管IO是否成功都会直接返回,不会阻塞住线程。你需要提供一个回调函数给AIO接口,一旦底层系统内核完成了具体的IO请求,比如网络读写之类的,就会回调你提供的回调函数。

原文地址:https://www.cnblogs.com/ttaall/p/15123298.html