高性能I/O设计模式Reactor和Proactor

昨天购买了《程序猿》杂志 2007.4期，第一时间去翻阅了一遍，当中有一篇《两种高性能I/O设计模式的比較》令人眼睛一亮，这是一篇译文，偶近期在一直想认真看看这方面的文章非常久了。

文章主要是讲到了系统I/O方式可分为堵塞，非堵塞同步和非堵塞异步三类，三种方式中，非堵塞异步模式的扩展性和性能最好。主要是讲了两种IO多路复用模式：Reactor和Proactor，并对它们进行了比較。

文章还介绍了为Reactor和Proactor模式构建一个通用的，统一的对外接口并是一个全然可移植的开发框架选择方案：TProactor (ACE compatible Proactor) ：http://www.terabit.com.au/solutions.php。由于Linux对aio支持的不完整，所以ACE_Proactor框架在linux上的表现非常差，大部分在windows上执行正常的代码，在Linux则执行异常，甚至不能编译通过。这个问题一直困扰着非常大多数ACE的用户，如今好了，有一个TProactor帮助攻克了在Linux不完整支持AIO的条件下，正常使用（至少是看起来正常）ACE_Proactor。

文章主要摘要：

---------->

两种I/O多路复用模式：Reactor和Proactor

一般地,I/O多路复用机制都依赖于一个事件多路分离器(Event Demultiplexer)。分离器对象可将来自事件源的I/O事件分离出来，并分发到相应的read/write事件处理器(Event Handler)。开发者预先注冊须要处理的事件及其事件处理器（或回调函数）；事件分离器负责将请求事件传递给事件处理器。两个与事件分离器有关的模式是Reactor和Proactor。Reactor模式採用同步IO，而Proactor採用异步IO。
在Reactor中，事件分离器负责等待文件描写叙述符或socket为读写操作准备就绪，然后将就绪事件传递给相应的处理器，最后由处理器负责完毕实际的读写工作。
而在Proactor模式中，处理器--或者兼任处理器的事件分离器，仅仅负责发起异步读写操作。IO操作本身由操作系统来完毕。传递给操作系统的參数须要包含用户定义的数据缓冲区地址和数据大小，操作系统才干从中得到写出操作所需数据，或写入从socket读到的数据。事件分离器捕获IO操作完毕事件，然后将事件传递给相应处理器。比方，在windows上，处理器发起一个异步IO操作，再由事件分离器等待IOCompletion事件。典型的异步模式实现，都建立在操作系统支持异步API的基础之上，我们将这样的实现称为“系统级”异步或“真”异步，由于应用程序全然依赖操作系统运行真正的IO工作。
举个样例，将有助于理解Reactor与Proactor二者的差异，以读操作为例（类操作相似）。
在Reactor中实现读：
- 注冊读就绪事件和相应的事件处理器
- 事件分离器等待事件
- 事件到来，激活分离器，分离器调用事件相应的处理器。
- 事件处理器完毕实际的读操作，处理读到的数据，注冊新的事件，然后返还控制权。
与例如以下Proactor（真异步）中的读过程比較：
- 处理器发起异步读操作（注意：操作系统必须支持异步IO）。在这样的情况下，处理器无视IO就绪事件，它关注的是完毕事件。
- 事件分离器等待操作完毕事件
- 在分离器等待过程中，操作系统利用并行的内核线程运行实际的读操作，并将结果数据存入用户自己定义缓冲区，最后通知事件分离器读操作完毕。
- 事件分离器呼唤处理器。
- 事件处理器处理用户自己定义缓冲区中的数据，然后启动一个新的异步操作，并将控制权返回事件分离器。

实践现状
由Douglas Schmidt等人开发的开源C++开发框架ACE，提供了大量与平台无关，支持并发的底层类（线程，相互排斥量等），且在高抽象层次上，提供了两组不同的类--ACE Reactor和ACE Proactor的实现。只是，尽管二者都与平台无关，提供的接口却各异。
ACE Proactor在windows平台上具有更为优异的性能表现，由于windows在操作系统提供了高效的异步API支持（见http://msdn2.microsoft.com/en-us/library/aa365198.aspx）。
然而，并不是全部的操作系统都在系统级大力支持异步。像非常多Unix系统就没做到。因此，在Unix上，选择ACE Reactor解决方式可能更好。但这样一来，为了获得最好的性能，网络应用的开发者必须为不同的操作系统维护多份代码：windows上以ACE Proactor为基础，而Unix系统上则採用ACE Reactor解决方式。

改进方案
在这部分，我们将尝试应对为Proactor和Reactor模式建立可移植框架的挑战。在改进方案中，我们将Reactor原来位于事件处理器内的read/write操作移至分离器(最好还是将这个思路称为“模拟异步”)，以此寻求将Reactor多路同步IO转化为模拟异步IO。以读操作为样例，改进步骤例如以下：
- 注冊读就绪事件及其处理器，并为分离器提供数据缓冲区地址，须要读取数据量等信息。
- 分离器等待事件（如在select()上等待）
- 事件到来，激活分离器。分离器运行一个非堵塞读操作（它有完毕这个操作所需的全部信息），最后调用相应处理器。
- 事件处理器处理用户自己定义缓冲区的数据，注冊新的事件（当然相同要给出数据缓冲区地址，须要读取的数据量等信息），最后将控制权返还分离器。
如我们所见，通过对多路IO模式功能结构的改造，可将Reactor转化为Proactor模式。改造前后，模型实际完毕的工作量没有添加，仅仅只是參与者间对工作职责稍加调换。没有工作量的改变，自然不会造成性能的削弱。对例如以下各步骤的比較，能够证明工作量的恒定：
标准/典型的Reactor：
- 步骤1：等待事件到来（Reactor负责）
- 步骤2：将读就绪事件分发给用户定义的处理器（Reactor负责）
- 步骤3：读数据（用户处理器负责）
- 步骤4：处理数据（用户处理器负责）
改进实现的模拟Proactor：
- 步骤1：等待事件到来（Proactor负责）
- 步骤2：得到读就绪事件，运行读数据（如今由Proactor负责）
- 步骤3：将读完毕事件分发给用户处理器（Proactor负责）
- 步骤4：处理数据（用户处理器负责）

对于不提供异步IO API的操作系统来说，这样的办法能够隐藏socket API的交互细节，从而对外暴露一个完整的异步接口。借此，我们就能够进一步构建全然可移植的，平台无关的，有通用对外接口的解决方式。

上述方案已经由Terabit P/L公司（http://www.terabit.com.au/）实现为TProactor。它有两个版本号：C++和JAVA的。C++版本号採用ACE跨平台底层类开发，为全部平台提供了通用统一的主动式异步接口。
Boost.Asio库，也是採取了相似的这样的方案来实现统一的IO异步接口。

<-----------

近期在项目中使用了Boost.Asio类库，其就是以Proactor这样的设计模式来实现，參见：Proactor（The Boost.Asio library is based on the Proactor pattern. This design note outlines the advantages and disadvantages of this approach.），其设计文档链接：http://asio.sourceforge.net/boost_asio_0_3_7/libs/asio/doc/design/index.html

First, let us examine how the Proactor design pattern is implemented in asio, without reference to platform-specific details.

Boost.Asio的Proactor模式实现图示

Proactor design pattern (adapted from [1])

当然这两I/O设计模式，也在ACE中被大量应用，这在ACE的相关书籍中都有介绍，当中在“ACE开发人员”站点中有非常多不错的介绍文章。

如：ACE技术论文集-第8章前摄器（Proactor）：用于为异步事件多路分离和分派处理器的对象行为模式

ACE技术论文集-第7章 ACE反应堆（Reactor）的设计和使用：用于事件多路分离的面向对象构架

ACE程序猿教程-第6章反应堆（Reactor）：用于事件多路分离和分派的体系结构模式

ACE应用-第2章 JAWS：高性能Webserver构架

Proactor模式在单CPU单核系统应用中有着无可比拟的优势，如今面临的问题是：在多CPU多核的系统中，它怎样更好地应用多线程的优势呢？？？这是非常值思考和实践的，或许会产生第二种设计模式来适应发展的须要啦。