java NIO(转)

java NIO 前言

我从大二开始学习Java，一直偏重于J2EE领域，写多了SSH、SSM代码之后，Java让我失去了新鲜感，以为调调接口就完事了。笔者一度开始拥抱Go语言，直到我知道“JAVA NIO”这回事，才发现，JAVA能做的有很多。比如在多线程(java.util.concurrent)及网络领域(java.nio)，老树开新花。

io即输入输出，输入输出的源头与目的地主要是网络和文件，我们先从比较简单的文件IO说起。

文件IO

以读取文件为例：

// FileInputStream或BufferedInputStream
Byte[] b = new byte[1024]; // 开启1m的缓冲区
while(in.read(b) != -1){
    Xxx
}

# nio方式
FileInputStream fin = new FileInputStream( "readandshow.txt" );
FileChannel fc = fin.getChannel();
ByteBuffer buffer = ByteBuffer.allocate(1024);
fc.read(buffer);

传统的io代码，这个缓冲区（byte数组）是程序员约定俗成的行为。在jdk较新版本中，传统io类实际是用nio类实现的。

在java nio中，这个缓冲区被固定下来，数据直接被读取到缓冲区中。或者说，原先的Stream是Channel和Buffer的组合。

实际上，内核在读取java文件时，会将文件的部分内容拷贝到缓冲区块中。进行网络通信时，网络数据会最新到达tcp接收缓冲区中。Channel用于在字节缓冲区和位于通道另一侧实体（文件或套接字）的字节缓冲区之间有效地传输数据。使用buffer则使read()和write()调用得到了极大的简化，因为许多工作细节都由缓冲区完成了。clear()和flip()方法用于让缓冲区在读和写之间切换。

网络IO

在阻塞IO模式下，从网络中读取数据的过程是

InputeStream in = socket.getInputStream();
in.read();

这相当于用户线程主动去查询是否收到数据，读写事件的发起者是用户线程。java的nio框架主要基于Reactor模式（nio中的学名叫selector），有一个专门的reactor线程去监听注册的套接字，当发生连接建立和读写事件时，通知用户线程处理。此时，事件的发起者是Reactor线程。

而Reactor模式又与观察者模式类似，我们先从观察者模式开始。

从观察者模式讲起

假设有一个目标对象（Objector）和一个观察者对象（Observer），Observer想要知道Objector状态，有两种办法：

轮询（可以理解为pull的方式）

Objector状态发生变化时，主动通知Observer（可以理解为push的方式，事件源主动告知Observer）

 class Objector{
     List<Observer> observers;
     change(){
         // 变化
         // 通知观察者
         for(Observer observer : observers){
             observer.xxxx
         }
     }
 }

我们将这个模型简单的拓展一下，假设Observer要观察两个Objector的变化（Objector1和Objector2），那么我们可以：

class Objector1{
    List<Observer> observers;
    change(){
        // 变化1
        // 通知观察者
        for(Observer observer : observers){
            observer.xxxx
        }
    }
    change2(){
        // 变化2
        // 通知观察者
        for(Observer observer : observers){
            observer.xxxx
        }
    }
}
class Objector2{
    List<Observer> observers;
    change(){
        变化
        for(Observer observer : observers){
            observer.xxxx
        }
    }
}

但这样没有什么扩展性，比如无法支持“change2的只有个别Observer才关心”这样的需求。

计算机里的所有问题，可以试试加个中间层解决。于是，我们将Objector1中保存观察者的容器，以及通知观察者的代码提取出来，Objector有什么事就告诉中间件，Observer关心什么事也告诉中间件，然后由中间件负责准确的通知。

class Objector1{
    中间件 middleware
    change(){
        middleware.func(变化信息)
    }
}

class 中间件{
    Map<感兴趣的事件，观察者列表>
    func(){
        While(true){
            查询object1和object2有没有变化
            有，就根据映射拿到观察者，调用观察者处理
        }
    }
}

这便是Reactor模式的一个简要雏形。观察者模式与单个事件源关联，而反应器模式则与多个事件源关联。

换个方式写WebServer

以一个web服务器为例，最简单的例子是这样的

class SingleThreadWebServer{
    public static void main(String[] args) throws IOException{
        ServerSocket socket = new ServerSocket();
        while(true){
            Socket connection = socket.accept();	//看到这个变量名，我好像明白，为什么叫"连接"池了
            handleRequest(connection);
        }
    }
}

上述代码有两个阻塞的点， socket.accept()和connection.read()，很明显一个线程忙不过来，so

class ThreadPerTaskWebServer{
    public static void main(String[] args) throws IOException{
        ServerSocket socket = new ServerSocket();
        while(true){
            final Socket connection = socket.accept();
            Runnable task = new Runnable(){
            	public void run(){
                	handleRequest(connection);
                }
            }
            new Thread(task).start();
        }
    }
}

如果请求过多，这种方式会无限制创建线程。当然，我们可以使用Executor来执行task。但共同点都是，一个work线程处理一个connection。如果请求不是很繁忙，主线程会阻塞在socket.accept()上，work线程会阻塞在connection.read()上。

使用nio方式

public class NIOServer{
    public static void main(String[] args) throws IOException{
        Selector selector = Selector.open();
        ServerSocketChannel serverSocketChannel = ServerSocketChannel.open();
        serverSocketChannel.configureBlocking(false);
        serverSocketChannel.socket().bind(new InetSocketAddress(80));
        serverSocketChannel.register(selector, SelectionKey.OP_ACCEPT);
        while(true){
        	selector.select(1000);
			Set<SelectionKey> selectedKeys = selector.selectedKeys();
			Iterator<SelectionKey> it = selectedKeys.iterator();
        	SelectionKey key = null;
			while (it.hasNext()) {
                key = it.next();
                it.remove();
                handleInput(key);
	 		}
        }
    }
    public static void handleInput(SelectionKey key) throws IOException{
    	if(key.isAcceptable()) {
            // Accept the new connection
            ServerSocketChannel ssc = (ServerSocketChannel) key.channel();
            SocketChannel sc = ssc.accept();
            sc.configureBlocking(false);
            // Add the new connection to the selector
            sc.register(selector, SelectionKey.OP_READ);
        } else if (key.isReadable()) {
            SocketChannel sc = (SocketChannel) key.channel();
			ByteBuffer readBuffer = ByteBuffer.allocate(1024);
            // handle buffer
        }
    }
}

上述代码只有一个阻塞的点selector.select(1000)（此处设置了超时时间），如果使用work线程处理readable SelectionKey，work线程不会被阻塞。除此之外，nio与传统io方式有以下不同：

所有通道上的所有事件集中监听selector.select(1000)，不管是ServerSocketChannel对应SocketChannel（监听Acceptable事件）还是普通的SocketChannel（监听Readable事件），在selector看来没有区别。
监听到的事件可批量处理，比如一个selector.select(1000)返回后得到一个Acceptable事件和两个Readable事件。这样，一个线程就可以负责多个socket
能够将io线程与业务线程（处理读数据，生成写数据）分离

selector成为一个全面的，类似消息总线的功能。但java nio 不是万能的

selector会降低一些事件的响应速度。
主线程（运行selector.select(1000)）的安全变得异常重要

其它

与Selector一起使用时，Channel必须处于非阻塞模式下（以read为例，read调用立即返回，返回实际的数据或错误号）。因为FileChannel不能切换到非阻塞模式（只要文件存在且未读完，读文件总会返回数据，而网络则不然），FileChannel与Selector一起使用，selector基本只用于套接字通道。

如果过多的设备与服务器进行网络通信，那么一个selector有可能把它累着，我们可以引入多个selector，这又引入了多个selector的管理问题，这就用到了mina和netty等框架。