Operating Systems 3 Easy Pieces 阅读笔记：Chapter 36 I/O设备

Chapter 36 I/O设备

第三部分是持久化Persistence。

在介绍持久化之前，先了解输入输出设备input/output (I/O) device，以及操作系统如何和这些输入输出设备被打交道。

核心问题：IO设备是如何集成进系统的？他们通用的特性有哪些？如何使对它的操作变得高效？

1 系统架构 System Architecture

一个典型的系统架构如上图所示。CPU和主存通过Memory Bus直接连接；

一些高性能设备如显卡，通过General I/O BUS （比如PCI)进行连接。

接下来是外围总线（peripheral bus），连接低速设备（SCSI, SATA, or USB）

2 一个标准的设备（A Canonical Device）

一个标准设备由两部分组成：

1. 向外面系统暴露的“硬件接口”(interface)，来让操作系统进行操作和控制

2 .内部结构，具体实现暴露接口的功能，以及内部运行。简单的设备可以再一个小芯片上硬编码完成功能，复杂的设备自身会有一个CPU,一个小内存，还有一些专用芯片（device-specific chip）来完成上述工作。像RAID的控制器还会有上千行代码的固件（Firmware->software within a hardware device)。

3. 一个标准协议 (The Canonical Protocol)

再上述化简的设备中，包含了一个设备需要的最基础的三个寄存器：

- Status寄存器，表示当前设备的状态

- Data寄存器，用于传data给设备，或者从设备中取出data

- Command寄存器，用于告诉设备去执行具体的任务

那么一个简单的协议如下所示:

上述协议四步走，

1. 轮询设备的状态是否为BUSY；

2. 拷贝数据到DATA寄存器

3. 通知设备处理

4. 轮询设备状态（看看是不是完成了，或者出现了错误）

When the main CPU is involved with the data movement (as in this example protocol),

we refer to it as programmed I/O (PIO).

PIO: CPU亲自参与数据从内存到设备的拷贝工作，如第二步。

上述方法的好处在于简单并且能健壮工作。

但是，上述方法并不便捷而且低效：轮询会消费大量的CPU时，阻止CPU去处理别的进程的任务。

4. 通过中断来降低CPU的浪费（Lowering CPU Overhead With Interrupts）

通过中断和上下文切换，可以做到多进程任务的重叠执行：

上图表示Disk在写1的时候，CPU切出去执行2，Disk在Finish之后会出发终端让CPU回来执行1.

但是，进行上下文的切换本身也是有成本的。

如果设备本身足够快，切换上下文的成本是得不偿失的。POLLING轮询是更好的选项。

如果设备的速度是未知的，可以采用混合(hybrid)的策略：先轮询一会，如果设备还是没有完成任务，就进入中断。

在网络应用的考虑中，也不建议使用中断。大量的包同时连接主机，如果使用中断，可能会导致livelock:切出了太多太多执行体，导致系统除了context switch啥也干不了。（* 所以handle 一个 request 就开一个线程（即使线程本身没有开销）也是不合理的，可以使用M:N线程来获得对执行本身的control和多路复用之间的平衡 *）。

还有一种基于中断的优化是聚合（coalescing）。在这种情况下，每次设备想发起中断时先等待一段时间，看看会不会有其他requests也要完成了，如果有就打包成一个中断发送给系统。当然等待时间本来就会带来延迟，因此这种方法也需要工程上的权衡。

5. 更进一步：用DMA来加速数据拷贝(More Efficient Data Movement With DMA)

在我们的标准设备中，还有一个值得注意的问题。就是PIO(Programmed I/O)传输大块大块的数据，CPU手把手把数据从内存往设备拷贝的时候，CPU的负担依旧时很重的，而且用在了一个这么简单的任务上，应该把这部分负担解决掉，PIO的时间用来处理别的进程。

那么如何降低PIO带来的浪费？

在设备Device和主存Main Memory之间引入DMA（Direct Memeory Access）Engine。

有DMA之后，操作系统就会告诉DMA数据在内存中的位置，长度，以及输送的目标，然后context switch去执行别的任务，知道数据拷贝完成，如下所示:

6. 与设备交互的方法（Methods Of Device Interaction）

1. explicit I/O instructions

IBM发明的，显式的命令，让OS来发送数据给某个具体设备的register，然后再进行上述的protocol。

在x86指令集上，就有in和out的指令来操作设备。比如向设备发送数据，执行体就要给两个参数，一个是目前保存了数据的寄存器，另一个是具体的port指向一个具体的设备。

这样的命令往往是高权限的，会带来一些安全问题。

2. memory-mapped I/O

把硬件的寄存器映射到内存地址中，这样就能像访存写存一样操作设备。

To access a particular register, the OS issues a load (to read) or store (to write) the address; the hardware then routes the load/store to the device instead of main memory.

7. 接入OS：设备驱动（Fitting Into The OS：The Device Driver）

越通用越好：As Gerneral As Possible

一个文件系统，应该能在SCSI, IDE, USB的设备上都能使用

进行抽象↓↓↓