Netty(二)线程模型

1. Netty概述

虽然Java已经提供了NIO,但原生NIO仍存在部分问题:

  1. NIO的类库和API繁杂,使用麻烦。需要熟练掌握Selector、ServerSocketChannel、SocketChannel、ByteBuffer等
  2. 需要具备其他的额外技能:要熟悉Java多线程编程,因为NIO编程涉及到Reactor模式,必须对对多线程和网络编程非常熟悉,才能编写出高质量的NIO程序
  3. 开发工作量和难度都非常大:例如客户端面临断连重连、网络闪断、半包读写、失败缓存、网络拥塞和异常流的处理等等
  4. JDK NIO的Bug:例如臭名昭著的Epoll Bug,它会导致Selector空轮询,最终导致CPU 100%。知道JDK 1.7 版本该问题仍旧存在,没有被根本解决

Netty官网(https://netty.io/)说明:

Netty is a NIO client server framework which enables quick and easy development of network applications such as protocol servers and clients

 

再次回顾Netty的特点:

  1. Netty是由JBOSS提供的一个Java开源框架。Netty提供异步、基于事件驱动的网络应用程序框架,用以快速开发高性能、高可靠的网络IO程序
  2. Netty可以帮助你快速、简单地开发出一个网络应用,相当于简化和流程化了NIO的开发过程
  3. Netty是目前最流行的NIO框架,在互联网领域、大数据分布式计算领域、游戏行业、通信行业等获得了广泛的应用,知名的Elasticsearch、Dubbo框架内部都采用了Netty

1.1. Netty的优点

Netty对JDK自带的NIO的API进行了封装,解决了上述问题。

  1. 设计优雅:适用于各种传输类型的统一API阻塞和非阻塞Socket;基于灵活且可扩展的事件模型,可以清晰地分离关注点;高度可定制的线程模型 – 单线程,一个或多个线程池
  2. 使用方便:详细记录的Javadoc,用户指南和示例;没有其他依赖项,JDK 5(Netty 3.x)或 6(Netty 4.x)就足够了
  3. 高性能、吞吐量更高:延迟更低;减少资源消耗:最小化不必要的内存复制
  4. 安全:完整的SSL/TLS和StartTLS支持
  5. 社区活跃、不断更新:社区活跃,版本迭代周期短,发现的Bug可以被及时修复,同时,更多的新功能会被加入

1.2. Netty版本

Netty版本分为netty3.x、netty4.x、netty5.x。因为netty5.x出现了重大bug,所以被官方废弃了,目前推荐使用的是netty4.x的稳定版本。

下载地址:

https://netty.io/downloads.html

2. 线程模型基本介绍

对不同的线程模式,对程序的性能有很大影响,为了搞清Netty线程模式,我们系统地讲解下各个线程模式,看看Netty线程模型有什么优越性。

目前存在的线程模型有:

  1. 传统阻塞I/O服务模型
  2. Reactor模式

根据Reactor的数量和处理资源池线程的数量不同,有3种典型的实现:

  1. 单Reactor单线程
  2. 单Reactor多线程
  3. 主从Reactor多线程

Netty线程模式主要基于主从Reactor多线程模型做了一定的改进,其中主从Reactor多线程模型有多个Reactor

2.1. 传统阻塞I/O服务模型

如下所示:

 

黄色表示对象,蓝色表示线程,白色表示方法。

模型特点:

  1. 采用的是阻塞I/O模型,获取输入数据
  2. 每个连接都需要独立的线程完成数据的输入、业务处理、数据返回

模型问题:

  1. 当并发数很大时,会创建大量的线程,占用大量系统资源
  2. 连接创建后,如果当前线程暂时没有数据可读,该线程会阻塞在read操作,造成线程资源浪费

2.2. Reactor模式

针对传统阻塞I/O服务模型的2个缺点,解决方案:

  1. 基于I/O复用模型:多个连接共用一个阻塞对象,应用程序只需要在一个阻塞对象等待,无需阻塞等待所有连接。当某个连接有新的数据可以处理时,操作系统通知应用程序,线程从阻塞状态返回,开始进行业务处理
  2. 基于线程池复用线程资源:不必再为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务

Reactor模式也叫反应器模式、分发者模式(Dispatcher)、通知者模式(Notifier)

 

此图的说明:

  1. Reactor模式:通过一个或多个输入同时传递给服务处理器的模式(基于事件驱动)
  2. 服务器端程序处理传入的多个请求,并将它们同步分派到相应的处理现场,因此Reactor模式也叫Dispatcher模式
  3. Reactor模式使用IO复用监听事件,收到事件后,分发给某个线程(进程),这就是网络服务器高并发处理的关键

3. Reactor 模式详述

根据Reactor的数量和处理资源池线程的数量不同,有3种典型的实现:

  1. 单Reactor单线程
  2. 单Reactor多线程
  3. 主从Reactor多线程:是Netty基于的模式

3.1. 单Reactor单线程

如下图所示:

 

方案说明:

  1. select 是前面I/O复用模型介绍的标准网络编程API,可以实现应用程序通过一个阻塞对象监听多路连接请求
  2. Reactor对象通过Select监控客户端请求事件,收到事件后通过Dispatch进行分发
  3. 如果是建立连接请求事件,则由Acceptor通过Accept处理连接请求,然后创建一个Handler对象处理连接完成后的后续业务处理
  4. 如果不是建立连接事件,则Reactor会分发调用连接对应的Handler来响应
  5. Handler会完成Read -> 业务处理 -> Send的完整业务流程

服务端用1个线程通过多路复用搞定所有的IO操作(包括连接、读、写等),编码简单,清晰明了。但是如果客户端连接数量较多,将无法支撑。

单Reactor单线程优缺点:

  1. 优点:模型简单,没有多线程、进程通信、竞争的问题,全部都在一个线程中完成
  2. 缺点:性能问题,只有1个线程,无法完全发挥多核CPU的性能。Handler在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈
  3. 缺点:可靠性问题,线程意外终止,或是进入死循环,会导致整个系统通信模块不可用,不能接受和处理外部消息,造成节点故障
  4. 使用场景:客户端的数量有限,业务处理非常快速

3.2. 单Reactor多线程

如下图所示:

 

方案说明:

  1. Reactor对象通过select 监控客户端请求事件,收到事件后,通过dispatch进行分发
  2. 如果是建立连接请求,则由Acceptor 对象通过accept处理连接请求,然后创建一个Handler对象处理完成连接后的各种事件
  3. 如果不是连接请求,则由Reactor分发调用连接对应的handler来处理
  4. Handler只负责响应事件,不做具体的业务处理。通过read读取数据后,会分发给后面的worker线程池的某个线程处理业务
  5. Worker线程池会分配独立线程完成真正的业务,并将结果返回给handler
  6. Handler收到响应后,通过send将结果返回给client

单Reactor多线程优缺点:

  1. 优点:可以充分利用多核CPU的处理能力
  2. 缺点:多线程数据共享和访问比较复杂,reactor处理所有的事件的监听和响应,在单线程运行,在高并发场景会出现性能瓶颈

3.3. 主从Reactor多线程

针对单Reactor多线程模型中,Reactor在单线程中运行,高并发场景下容易成为性能瓶颈,可以让Reactor在多线程中运行。

 

方案说明:

  1. Reactor主线程MainReactor对象通过select监听连接事件,收到事件后,通过Acceptor处理连接事件
  2. 当Acceptor处理连接事件后,MainReactor将连接分配给SubReactor
  3. SubReactor将连接加入到连接队列进行监听,并创建Handler进行各种事件处理
  4. 当有新的事件发生时,subreactor就会调用对应的handler进行处理
  5. Handler通过read读取数据,分发给后面的worker线程进行处理
  6. Worker线程池会分配独立的worker线程进行业务处理并返回结果
  7. Handler收到响应的结果后,再通过send方法将结果返回给client
  8. Reactor主线程可以对应多个Reactor子线程,即MainReactor可以关联多个subReactor

需要注意的是,Reactor子线程并不是一个,而是多个。

在Scalable IO in Java 这本书中,对Multiple Reactors的原理图解为:

 

主从Reactor多线程方案优缺点说明:

  1. 优点:父线程与子线程的数据交互简单职责明确,父线程只需要接收新连接,子线程完成后续的业务处理
  2. 优点:父线程与子线程的数据交互简单,Reactor主线程只需要把新连接传给子线程,子线程无需返回数据
  3. 缺点:编程复杂度较高

结合实例:这种模型在许多项目中使用广泛,包括Nginx主从Reactor多进程模型,Memcached主从多线程,Netty主从多线程模型的支持。

3.4. Reactor模式小结

以生活案例来理解 Reactor模式:

  1. 单reactor单线程:前台接待员和服务员是同一个人,全程为顾客服务
  2. 单reactor多线程:1个前台接待员,多个服务员,接待员只负责接待
  3. 主从reactor多线程:多个前台接待员,多个服务生

Reactor模式具有以下优点:

  1. 响应快,不必为单个同步时间所阻塞,虽然Reactor本身依然是同步的
  2. 可以最大程度的避免复杂的多线程以及同步问题,并且避免了多线程/进程的切换开销
  3. 扩展性好:可以方便的通过增加Reactor实例个数来充分利用CPU资源
  4. 复用性好:Reactor模型本身与具体事件处理逻辑无关,具有很高的复用性

------------------------------------

此 Netty 笔记为学习尚硅谷韩老师讲的 Netty 整理完成,原视频讲解十分详细,建议对 Netty 框架感兴趣的同学们可以看一遍原视频:

https://www.bilibili.com/video/BV1DJ411m7NR

原文地址:https://www.cnblogs.com/zackstang/p/14584235.html