问题:
现如今,我们使用通用的应用程序或库来相互通信。例如,我们经常使用HTTP客户端库从服务器上获取信息并通过web服务执行远程过程调用。但是,通用协议或它的实现有时并不能很好的伸缩。这就像我们不会使用通用HTTP服务器来交换大文件、电子邮件、还有像金融信息、游戏数据等实时信息。这些业务所需要的是高度优化实现协议,用于专门的目的。例如,您可能希望实现一个针对基于ajax的聊天应用程序、媒体流应用、大文件传输进行优化的http服务器。您甚至可能想要设计并实现一个完全符合您的需求的新协议。另一个不可避免的情况是,你不得不去处理一个遗留的专有协议,来保证和旧系统的互操作性。在这些情况下,重要的是在不牺牲最终应用程序的稳定性和性能的前提前,如何尽可能快的实现该协议。
解决方案:
Netty项目致力于提供一个异步事件驱动的网络应用框架和工具,以便快速开发可维护的高性能和高扩展性协议的服务器和客户端。
换句话说,Netty是一个NIO服务器客户端框架,它支持快速简单的开发协议服务器和客户端等网络应用程序。它极大的简化和流线化了网络开发(例如TCP和UDP安全套接字服务器开发)。
快速和简单并不意味着最终的应用程序会出现可维护性和性能问题。Netty经过精心设计,从许多已实现协议(例如FTP、SMTP、HTTP)和众多二进制和基于文本的协议中吸取经验。最终,Netty在不妥协的前提下成功找到一个方法来实现简单的开发、高性能、稳定、灵活的应用。
一些开发者可能已经找到其他声称具有相同优势的网络应用框架,那么你可能会问Netty与它们有什么不同。答案是它所基于的哲学,Netty旨在从第一天起就为你提供最舒服的API和实现体验。它并不是什么有形的东西,但是当你阅读这份指南并使用Netty时你会发现:这个哲学将使你的生活更加的简单。
线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务。线程池线程都是后台线程。每个线程都使用默认的堆栈大小,以默认的优先级运行,并处于多线程单元中。如果某个线程在托管代码中空闲(如正在等待某个事件),则线程池将插入另一个辅助线程来使所有处理器保持繁忙。如果所有线程池线程都始终保持繁忙,但队列中包含挂起的工作,则线程池将在一段时间后创建另一个辅助线程但线程的数目永远不会超过最大值。超过最大值的线程可以排队,但他们要等到其他线程完成后才启动。
不同的线程模式,对程序的性能有很大影响,了解下各个线程模式,有助于搞清Netty线程模式。
目前存在的线程模型有:传统阻塞 I/O 服务模型和Reactor模式。
根据 Reactor 的数量和处理资源池线程的数量不同,有 3 种典型的实现,分别是:单Reactor 单线程、单Reactor 多线程、主从 Reactor 多线程。
Netty 线程模式(Netty 主要基于主从Reactor多线程模型做了一定的改进,其中主从 Reactor 多线程模型有多个 Reactor)。
工作原理图
黄色的框表示对象,蓝色的框表示线程,白色的框表示方法(API)。
模型特点
采用阻塞IO模式获取输入的数据,每个连接都需要独立的线程完成数据的输入、业务处理和数据返回。
问题分析
当并发数很大,就会创建大量的线程,占用很大系统资源;连接创建后,如果当前线程暂时没有数据可读,该线程会阻塞在read 操作,造成线程资源浪费。
针对传统阻塞 I/O 服务模型的两个缺点,解决方案如下:
1.基于 I/O 复用模型:多个连接共用一个阻塞对象,应用程序只需要在一个阻塞对象等待,无需阻塞等待所有连接。当某个连接有新的数据可以处理时,操作系统通知应用程序,线程从阻塞状态返回,开始进行业务处理Reactor 对应的叫法: a. 反应器模式 b. 分发者模式(Dispatcher) c. 通知者模式(notifier)。
2.基于线程池复用线程资源:不必再为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务。
I/O 复用结合线程池,就是 Reactor 模式基本设计思想,如图:
说明:
1.Reactor 模式,通过一个或多个输入同时传递给服务处理器的模式(基于事件驱动);
2.服务器端程序处理传入的多个请求,并将它们同步分派到相应的处理线程, 因此Reactor模式也叫 Dispatcher模式;
3.Reactor 模式使用IO复用监听事件, 收到事件后,分发给某个线程(进程), 这点就是网络服务器高并发处理关键;
Reactor 模式中的核心组成:
1.Reactor:Reactor 在一个单独的线程中运行,负责监听和分发事件,分发给适当的处理程序来对 IO 事件做出反应。它就像公司的电话接线员,它接听来自客户的电话并将线路转移到适当的联系人;
2.Handlers:处理程序执行 I/O 事件要完成的实际事件,类似于客户想要与之交谈的公司中的实际官员。Reactor 通过调度适当的处理程序来响应 I/O 事件,处理程序执行非阻塞操作。
Reactor 模式分类:
根据 Reactor 的数量和处理资源池线程的数量不同,有 3 种典型的实现,分别是:单 Reactor 单线程、单 Reactor 多线程、主从 Reactor 多线程。
工作原理示意图:
方案说明:
1.Select 是前面 I/O 复用模型介绍的标准网络编程 API,可以实现应用程序通过一个阻塞对象监听多路连接请求;
2.Reactor 对象通过 Select 监控客户端请求事件,收到事件后通过 Dispatch 进行分发;
3.如果是建立连接请求事件,则由 Acceptor 通过 Accept 处理连接请求,然后创建一个 Handler 对象处理连接完成后的后续业务处理;
4.如果不是建立连接事件,则 Reactor 会分发调用连接对应的 Handler 来响应;
5.Handler 会完成 Read→业务处理→Send 的完整业务流程。
优点:
1.模型简单,没有多线程、进程通信、竞争的问题,全部都在一个线程中完成。
缺点:
1.性能问题,只有一个线程,无法完全发挥多核 CPU 的性能。Handler 在处理某个连接上的业务时,整个进程无法处理其他连接事件,很容易导致性能瓶颈;
2.可靠性问题,线程意外终止,或者进入死循环,会导致整个系统通信模块不可用,不能接收和处理外部消息,造成节点故障。
使用场景:
客户端的数量有限,业务处理非常快速,比如 Redis在业务处理的时间复杂度 O(1) 的情况。
工作原理示意图:
针对单 Reactor 多线程模型中,Reactor 在单线程中运行,高并发场景下容易成为性能瓶颈,可以让 Reactor 在多线程中运行。
方案说明:
1.Reactor 对象通过select 监控客户端请求事件, 收到事件后,通过dispatch进行分发;
2.如果建立连接请求, 则右Acceptor 通过accept 处理连接请求, 然后创建一个Handler对象处理完成连接后的各种事件;
3.如果不是连接请求,则由reactor分发调用连接对应的handler 来处理;
4.handler 只负责响应事件,不做具体的业务处理, 通过read 读取数据后,会分发给后面的worker线程池的某个线程处理业务;
5.worker 线程池会分配独立线程完成真正的业务,并将结果返回给handler;
6.handler收到响应后,通过send 将结果返回给client。
优点:
可以充分的利用多核cpu 的处理能力
缺点:
多线程数据共享和访问比较复杂, reactor 处理所有的事件的监听和响应,在单线程运行, 在高并发场景容易出现性能瓶颈.
工作原理示意图:
针对单 Reactor 多线程模型中,Reactor 在单线程中运行,高并发场景下容易成为性能瓶颈,可以让 Reactor 在多线程中运行。
方案说明:
1.Reactor主线程 MainReactor 对象通过select 监听连接事件, 收到事件后,通过Acceptor 处理连接事件;
2.当 Acceptor 处理连接事件后,MainReactor 将连接分配给SubReactor ;
3.subreactor 将连接加入到连接队列进行监听,并创建handler进行各种事件处理;
4.当有新事件发生时, subreactor 就会调用对应的handler处理;
5.handler 通过read 读取数据,分发给后面的worker 线程处理;
6.worker 线程池分配独立的worker 线程进行业务处理,并返回结果;
7.handler 收到响应的结果后,再通过send 将结果返回给client;
8.Reactor 主线程可以对应多个Reactor 子线程, 即MainRecator 可以关联多个SubReactor。
优点:
1.父线程与子线程的数据交互简单职责明确,父线程只需要接收新连接,子线程完成后续的业务处理。
2.父线程与子线程的数据交互简单,Reactor 主线程只需要把新连接传给子线程,子线程无需返回数据。
缺点:
1.编程复杂度较高。
应用领域:
这种模型在许多项目中广泛使用,包括 Nginx 主从 Reactor 多进程模型,Memcached 主从多线程,Netty 主从多线程模型的支持。
结合生活案例理解:
1.单 Reactor 单线程,前台接待员和服务员是同一个人,全程为顾客服务;
2.单 Reactor 多线程,1 个前台接待员,多个服务员,接待员只负责接待;
3.主从 Reactor 多线程,多个前台接待员,多个服务生;
Reactor 模式具有如下的优点:
1.响应快,不必为单个同步时间所阻塞,虽然 Reactor 本身依然是同步的;
2.可以最大程度的避免复杂的多线程及同步问题,并且避免了多线程/进程的切换开销;
3.扩展性好,可以方便的通过增加 Reactor 实例个数来充分利用 CPU 资源;
4.复用性好,Reactor 模型本身与具体事件处理逻辑无关,具有很高的复用性。
工作原理示意图1-简单版:
Netty 主要基于主从 Reactors 多线程模型(如图)做了一定的改进,其中主从 Reactor 多线程模型有多个 Reactor。
方案说明:
1.BossGroup 线程维护Selector , 只关注Accecpt
2.当接收到Accept事件,获取到对应的SocketChannel, 封装成 NIOScoketChannel并注册到Worker 线程(事件循环), 并进行维护;
3.当Worker线程监听到selector 中通道发生自己感兴趣的事件后,就进行处理(就由handler), 注意handler 已经加入到通道。
工作原理示意图2-进阶版:
Netty 主要基于主从 Reactors 多线程模型(如图)做了一定的改进,其中主从 Reactor 多线程模型有多个 Reactor。
工作原理示意图3-详细版 :
方案说明:
1.Netty抽象出两组线程池 BossGroup 专门负责接收客户端的连接, WorkerGroup 专门负责网络的读写;
2.BossGroup 和 WorkerGroup 类型都是 NioEventLoopGroup;
3.NioEventLoopGroup 相当于一个事件循环组, 这个组中含有多个事件循环 ,每一个事件循环是 NioEventLoop;
4.NioEventLoop 表示一个不断循环的执行处理任务的线程, 每个NioEventLoop 都有一个selector , 用于监听绑定在其上的socket的网络通讯;
5.NioEventLoopGroup 可以有多个线程, 即可以含有多个NioEventLoop;
6.每个Boss NioEventLoop 循环执行的步骤有3步:
轮询accept 事件
处理accept 事件 , 与client建立连接 , 生成NioScocketChannel , 并将其注册到某个worker NIOEventLoop 上的 selector
处理任务队列的任务 ,即runAllTasks
7.每个 Worker NIOEventLoop 循环执行的步骤:
轮询read, write 事件
处理i/o事件, 即read , write 事件,在对应NioScocketChannel 处理
处理任务队列的任务 , 即 runAllTasks
8.每个Worker NIOEventLoop 处理业务时,会使用pipeline(管道), pipeline 中包含了 channel , 即通过pipeline 可以获取到对应通道, 管道中维护了很多的 处理器。