网络I/O模型--05多路复用I/O

        多路复用I/O模型在应用层工作效率比我们俗称的 BIO 模型快的本质原因是,前者不再使用操作系统级别的“同步 I/O”模型 。 在 Linux 操作系统环境下, 多路复用 I/O 模型就是技术人员通常简称的 NIO 技术。多路复用I/O 目前具体的实现主要包括四种: select、 poll , epoll 、kqueue 。

        多路复用 I/O技术最适用的是“高并发”场景,所谓高并发是指 l 毫秒内至少同时有成百上千个连接请求准备就绪,其他情况下多路复用I/O技术发挥不出它的明显优势 。

image

image

重要概念

    无论使用哪种实现方式,它们都会有“选择器”、 “通道”、 “缓存”这几个操作要素,那么可以为不同的多路复用盯0 技术创建一个统一的抽象组,井且为不同的操作系 统进行具体的实现。

 

Channel 通道: 是一个用来完成应用程序和操作系统交互事件、传递内容的渠道,注意是连接到操作系统。一个通道会有一个专属的文件状态描述符。既然是和操作系统进行内容的传递,那就说明应用程序可以通过通道从操作系统读取数据,也可以通过通道向操作系统写数据 。

image

Buffer数据缓存区 在 Java 原生 NIO 框架中,为了保证每个通道的数据读/写速度, Java NIO 框架为每一种需要支持数据读/写 的通道集成了 Buffer 的支持。Buffer 有两种工作模式: 写模式和读模式。在读模式下,应用程序只能从 Buffer 中 读取数据,不能进行写操作 。 但是在写模式下,应用程序是可以进行读操作的,这就表示可能会出现脏读的情况 。 所以一旦决定要从 Buffer 中读取数据,就一定要将 Buffer 的状态改为读模式 。
• position : 缓存区目前正在操作的数据块位置。
• limit:缓存区最大可以进行操作的位置。缓存区的读/写状态正是由这个属性控制的 。
• capacity:缓存区的最大容量 。这个容量是在缓存区创建时进行指定的。由于高井发时通道数量往往会很庞大,所以每一个缓存区的容量最好不要过大。

 

Selector选择器 可以把它称为“轮询代理器”、 “事件订阅器”、 “ Channel 容器管理机”等等。
事件订阅和 Channel 管理:应用程序将向 Selector 对象注册需要它关注的 Channel ,以及具体的某一个 Channel 会对哪些 I/O事件感兴趣。 Selector 中也会维护一个 “己经注册的 Channel“的容器 。 
轮询代理:应用层不再通过阻塞模式或者非阻塞模式直接询问操作系统“事件有没有发生”,而是由 Selector 代其询问。
实现不同操作系统的支持: 之前己经提到过, 多路复用I/O 技术是需要操作系统进行支持的,其特点就是操作系统可以同时扫描同一个端口上的多个网络连接 。 所以作为上层 的 JVM,必须要为不同操作系统的多路复用 I/O 实现编写不同 的代码 。

package testBlockSocket;

import java.net.InetSocketAddress;
import java.net.ServerSocket;
import java.net.URLDecoder;
import java.net.URLEncoder;
import java.nio.ByteBuffer;
import java.nio.channels.SelectableChannel;
import java.nio.channels.SelectionKey;
import java.nio.channels.Selector;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;
import java.util.Iterator;
import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class SocketServerReuseAddres {
    private final static Logger LOGGER = LoggerFactory.getLogger(SocketServerReuseAddres.class);
    private static final Map<Integer, StringBuffer> MESSAGEHASHCONTEXT = new ConcurrentHashMap<>();

    public static void main(String[] args) throws Exception {
        ServerSocketChannel serverChannel = ServerSocketChannel.open();
        // 一定要这样设置
        serverChannel.configureBlocking(false);
        ServerSocket serverSocket = serverChannel.socket();
        serverSocket.setReuseAddress(true);
        serverSocket.bind(new InetSocketAddress(8888));
        Selector selector = Selector.open();
        // 注意:服务器通道能且只能注册 SelectionKey . OP ACCEPT 事件
        serverChannel.register(selector, SelectionKey.OP_ACCEPT);
        try {
            while (true) {
                // 如果条件成立,则说明本次询问 selector 并没有获取任何准备好的、感兴趣的事件
                if (selector.select(100) == 0) {
                    // =============
                    // 这里祝业务情况,可以做一些其他业务动作,但实际意义不大
                    // =============
                    continue;
                }
                // 这就是本次询问操作系统所获取的“所关心的事件"的事件类型(每一个通道是独立的)
                Iterator<SelectionKey> selecionKeys = selector.selectedKeys().iterator();
                while (selecionKeys.hasNext()) {
                    SelectionKey readyKey = selecionKeys.next();
                    // 一定要移除这个已经处理的 readyKey 如果不移除,就会一直存在在 selector.selectedKeys 集合中 待到下一次 selector
                    // . select() > 0 时,这个 readyKey 又会被处理一次
                    selecionKeys.remove();
                    SelectableChannel selectableChannel = readyKey.channel();
                    if (readyKey.isValid() && readyKey.isAcceptable()) {
                        SocketServerReuseAddres.LOGGER.info("==channel 通道已经准备好===");
                        // 当 serverSocketChannel 通道已经准备好 , 就可以从 serverSocketChannel中获取socketChannel 了
                        // 拿到socketChannel后,要做的事情就是马上到
                        // selector注册这个socketChannel感兴趣的事情。否则无法监听到这个socketChannel到达的数据
                        ServerSocketChannel serverSocketChannel = (ServerSocketChannel) selectableChannel;
                        SocketChannel socketChannel = serverSocketChannel.accept();
                        registerSocketChannel(socketChannel, selector);
                    } else if (readyKey.isValid() && readyKey.isReadable()) {
                        SocketServerReuseAddres.LOGGER.info("======socket channel数据准备完成,可以去读==读取======= ");
                        readSocketChannel(readyKey);
                    }
                }
            }
        } catch (Exception e) {
            SocketServerReuseAddres.LOGGER.error(e.getMessage(), e);
        } finally {
            serverSocket.close();
        }

    }

    private static void registerSocketChannel(SocketChannel socketChannel, Selector selector) throws Exception {
        socketChannel.configureBlocking(false);
        // socket 通道可以且只可以注册三种事件! SelectionKey.OP_READ | SelectionKey.OP_WRITE |
        // SelectionKey.OP_CONNECT
        // 最后一个参数视为这个 socketchanne 分配的缓存区
        socketChannel.register(selector, SelectionKey.OP_READ, ByteBuffer.allocate(2048));
    }

    private static void readSocketChannel(SelectionKey readyKey) throws Exception {
        SocketChannel clientSocketChannel = (SocketChannel) readyKey.channel();
        // 获取客户端使用的端口
        InetSocketAddress sourceSocketAddress = (InetSocketAddress) clientSocketChannel.getRemoteAddress();
        Integer resoucePort = sourceSocketAddress.getPort();
        // 拿到这个 socket 通道使用的缓存区,准备读取数据
        // 解缓存区的用法实际上重要的就是三个元素: capacity 、 position 和 limit
        ByteBuffer contextBytes = (ByteBuffer) readyKey.attachment();
        // 将通道的数据写入缓存区
        // 由于之前设置了 ByteBuffer 的大小为 2048 byte ,所以可能存在写不完的情况
        int realLen = -1;
        StringBuffer message = new StringBuffer();
        while ((realLen = clientSocketChannel.read(contextBytes)) != 0) {
            // 一定要把 Buffer 切换成“读”模式 , 否则 由于 limit = capacity; 在 read 没有写满的情况下 , 就会导致多读
            contextBytes.flip();
            int position = contextBytes.position();
            int capacity = contextBytes.capacity();
            byte[] messageBytes = new byte[capacity];
            contextBytes.get(messageBytes, position, realLen);
            // 注意中文乱码的问题,使用 URLDecoder/URLEncoder 进行解编码,当然 Java NIO 框架本身也提供编解码方式,看个人使用习惯
            String messageEncode = new String(messageBytes, 0, realLen, "UTF-8");
            message.append(messageEncode);
            // 再切换成“写”模式,直接存入缓存的方式最快捷
            contextBytes.clear();
        }

        // 如果发现本次接收的信息中有“ over ” 关键字 , 说明信息接收完成
        if (URLDecoder.decode(message.toString(), "UTF-8").indexOf("over") != -1) {
            // 则从 messageHashContext 中 , 取出之前已经收到的信息 , 组合成完整的信息
            Integer channelUUID = clientSocketChannel.hashCode();
            SocketServerReuseAddres.LOGGER.info("端口 :" + resoucePort + "客户端发来的{言息 == ====message : " + message);
            StringBuffer completeMessage;
            // 清空 MESSAGEHASHCONTEXT 中的历史记录
            StringBuffer historyMessage = MESSAGEHASHCONTEXT.remove(channelUUID);
            if (historyMessage == null) {
                completeMessage = message;
            } else {
                completeMessage = historyMessage.append(message);
            }
            SocketServerReuseAddres.LOGGER.info("端口 :" + resoucePort + "客户端发来的完整 信息 ======completeMessage :"
                    + URLDecoder.decode(completeMessage.toString(), "UTF-8"));

            // ======================
            // 接收完成后,可以在这里正式处理业务了
            // ====================
            // 回发数据,并关闭 Channel
            ByteBuffer sendBuffer = ByteBuffer.wrap(URLEncoder.encode("回发处理结果", "UTF-8").getBytes());
            clientSocketChannel.write(sendBuffer);
            clientSocketChannel.close();
        } else {
            // 如果没有发现“ over ”关键字,说明还没有接收究,则将本次接收到的信息存入 MESSAGEHASHCONTEXT
            SocketServerReuseAddres.LOGGER.info("端口:" + resoucePort + "客户端信息还未接收完,继续接收======message :"
                    + URLDecoder.decode(message.toString(), "UTF-8"));

            // 每一个 Channel 对象都是独立的,所以可以使用对象的 Hash 值,作为唯一标识
            Integer channelUUID = clientSocketChannel.hashCode();
            // 然后获取这个 Channel 下以前已经到达的信息
            StringBuffer historyMessage = MESSAGEHASHCONTEXT.get(channelUUID);
            if (historyMessage == null) {
                historyMessage = new StringBuffer();
                MESSAGEHASHCONTEXT.put(channelUUID, historyMessage.append(message));
            }
            historyMessage.append(message);
        }
    }
}

      多路复用 I/O 技术由操作系统提供支持,并提供给各种高级语言进行使用。它针对阻塞式同步 I/O 和非阻塞式同步 I/O 而言有很多优势,最直接的效果就是它绕过了I/O在操作系统层面的 accept()方法的阻塞问题

      • 使用多路复用I/O技术后 ,应用程序就可以不用再单纯使用多线程技术来解决并发I/O处理的性能问题了(针对操作系统内核I/O 管理模块和应用程序进程而言都是这样的)。在实际业务的处理中 , 应用程序进程还是需要引 入 (由线程池支持的)多线程技术的。
       • 同一个端口可以处理多种网络协议。 例 如,使用 ServerSocketChannel 类的服务器端口监昕,既可以接收到 TCP 协议又可以接收到 UDP 协议内容。 也就是说端口的数据接收规则只和 Selector 注册的需要关心的事件有关。
       • 操作系统级别的优化 : 多路复用 I/O 技术可以使操作系统级别在一个端口上能够同时接受多个客户端的 I/O 事件,同时具有之前我们讲到的阻塞式同步 I/O 和非阻塞式同步I/O的所有特点。 Selector 的一部分作用更相当于 “轮询代理器”
       • 都是同步 I/O 模型:目前我们介绍的阻塞式 I/O 、非阻塞式I/O , 甚至包括多路复用I/O ,这些都是基于操作系统级别对“同步I/O”的实现。我们一直在说“同步I/O ”, 一直都没有详细说什么叫作“同步I/O”。实际上一句话就可以解释清楚: 只有上层 (包括上层的某种代理机制)系统询问“我”是否有某个事件发生了,否则“我”不会主动告诉上层系统事件发生了。

原文地址:https://www.cnblogs.com/gispathfinder/p/9031428.html