Swoole引擎原理(swoole为什么能提升PHP的速度)

首先，在网上找的信息说PHP代码执行的顺序是这样的，第一步是词法分析，第二步是语法分析，第三步是转化为opcode，第四部也就是顺序执行这些opcode了。

聪明如各位看到这里，再返回上面看一下这张图片，肯定就会有不一样的感觉了。咱们借用一句话来阐述这几个步骤：当PHP拿到一段代码后，经过词法解析、语法解析等阶段后，源程序会被翻译成一个个指令（opcodes）,然后ZEND虚拟机顺次执行这些指令完成操作。

我们都知道，PHP本身是用C实现的，因此最终调用的也是C的函数，实际上，我们可以把PHP看做一个C开发的软件。既然如此，那么PHP的代码执行的核心也就是翻译出来的一条一条指令，在这里就是opcode。

那么，我们就可以把opcode看成是PHP代码执行的最基本单位。所以PHP代码执行的本质也就可以理解为，我们的代码最终被翻译为一组opcode处理函数，完事之后再顺序执行。

有了这些认知之后，我们就来看下这个opcode究竟是什么鬼。本质上一个opcode由两个参数(op1，op2)、返回值和处理函数组成。它的官方解释就是PHP脚本编译后的中间语言，类似于java中的bytecode或者是.net中的MSL。

它的作用就是如下：

1、编译原理的中间过程会产生一种中间代码（语言），PHP由Zend引擎（C语言编写）编译后的中间代码为Opcode然后再交由Zend引擎处理，如同C语言编译后汇编代码然后再交由汇编。

2、生成的Opcode作为一种中间语言，可以帮助实现PHP源程序代码的不开源，如果你不想别人知道你的PHP代码是怎么写的，那你可以直接使用APC截取生成Opcode缓存文件，然后使用自己的PHP扩展加密程序对Opcode文件进行加密和解密，在Zend引擎对Opcode进行解析前进行解密然后再执行。

1、php-fpm 是如何处理web请求的？有什么问题？
我们用的 PHP 主要用于 web 开发，通过 nginx、apache 等服务端程序调用 php-fpm 处理服务端的业务逻辑，处理完后 php 撤消内存并返回结果。一个 web 请求就要加载一次 php 的全部文件，需要的系统资源开销很大，这是目前 php-fpm 的缺点之一；并且因为 php-fpm 在一次请求结束就释放内存，无法做连接池，也不合适 service 端的开发。我们用的 PHP 主要用于 web 开发，通过 nginx、apache 等服务端程序调用 php-fpm 处理服务端的业务逻辑，处理完后 php 撤消内存并返回结果。一个 web 请求就要加载一次 php 的全部文件，需要的系统资源开销很大，这是目前 php-fpm 的缺点之一；并且因为 php-fpm 在一次请求结束就释放内存，无法做连接池，也不合适 service 端的开发。

下面是 php-fpm 的运行流程，各位可以参考一下：

 1 http://www.test.cc
 2         |
 3       Nginx
 4         |
 5 路由到 http://www.test.cc/index.php
 6         |
 7 加载nginx的fast-cgi模块
 8         |
 9 fast-cgi监听127.0.0.1:9000地址
10         |
11 www.test.com/index.php请求到达127.0.0.1:9000
12         |
13 php-fpm 监听127.0.0.1:9000
14         |
15 php-fpm 接收到请求，启用worker进程处理请求
16         |
17 php-fpm 处理完请求并撤消内存，返回给nginx
18         |
19 nginx 将结果通过http返回给浏览器

2.swoole是如何解决php-fpm遇到的问题的？

swoole如何避免文件的反复加载：
swoole是完全的长驻内存的，长驻内存一个最大的好处就是可以性能加速。在fpm模式下，我们处理一个请求，通常会有一些空消耗,比如框架共用文件加载，配置文件加载，那么在swoole中，可以在onworkerstart的时候提前一次性把一些必要的文件和配置加载好，不必每次receive重复加载一遍，这样能提升不小的性能。

常驻内存
常驻内存。传统 PHP框架或者单文件，在处理每个请求之前，都要做一遍加载框架文件、配置的操作，请求完成之后会释放所有资源和内存，无须担心内存泄漏。但是如果请求数量上升，并发很高的时候，快速创建资源，又马上释放，会导致 PHP 程序运行效率急剧下降。而使用 Swoole 则没有这个问题：PHP的代码加载到内存后，拥有更长的生命周期，这样建立的数据库连接和其他大的对象，不被释放。每次请求只需要处理很少的代码，而这些代码只在第一次运行时，被 PHP 解析器编译，驻留内存。以后都是直接载入 OPCODE ，让 Zend 引擎直接运行。另外，之前PHP不能实现的，如数据库连接池，缓存连接池都可以在Swoole引擎下实现。系统的运行效率会大大提高。

swoole如何实现高并发

 1 请求到达 Main Reactor
 2         |
 3 Main Reactor 根据 Reactor 的情况，将请求注册给对应的 Reactor
 4 (每个 Reactor 都有 epoll,用来监听客户端的变化)
 5         |
 6 客户端有变化时，交给 worker 来处理
 7         |
 8 worker 处理完毕，通过进程间通信(比如管道、共享内存、消息队列)发给对应的 reactor
 9         |
10 reactor 将响应结果发给相应的连接
11         |
12 请求处理完成

因为reactor基于epoll，所以每个reactor可以处理很多个连接请求。如此，swoole就轻松的处理了高并发。

swoole如何实现异步I/O
swoole的worker进程有2种类型：一种是普通的worker进程，一种是task worker进程。
worker进程是用来处理普通的耗时不是太长的请求；task worker进程用来处理耗时较长的请求，比如数据库的I/O操作。

我们以异步Mysql举例：

 1 耗时较长的Mysql查询进入worker
 2             |
 3 worker通过管道将这个请求交给taskworker来处理
 4             |
 5 worker再去处理其他请求
 6             |
 7 task worker处理完毕后，处理结果通过管道返回给worker
 8             |
 9 worker 将结果返回给reactor
10             |
11 reactor将结果返回给请求方

如此，通过worker、task worker结合的方式，我们就实现了异步I/O。

总结一下 swoole 的技术特点：

1 常驻内存，避免重复加载带来的性能损耗，提升海量性能；
2 基于epoll，轻松支持高并发；
3 协程异步I/O，提高对I/O密集型场景并发处理能力；
4 支持多种通信协议，方便地开发 Http、WebSocket、TCP、UDP 等应用

3.swoole与php-fpm对比有哪些优缺点？

优点

1 常驻内存的 cli 运行模式，不用每次请求加载一次项目代码
2 大大提高了对连接请求的并发能力
3 协程异步I/O，提高对I/O密集型场景并发处理能力
4 支持多种通信协议，能搭建 TCP/UDP/UnixSocket 服务器
5 原生支持毫秒定时器

缺点

1 相关文档较少
2 不支持 xdebug，不支持手动 dump，不熟悉相关工具的话，不太方便调试
3 入门难度高，多数 phper 不了解 TCP/IP 网络协议、多进程 / 多线程、异步 io 等

3.进程的基本知识

对于一个进程来说，它的核心内容分为两个部分，一个是它的内存，这个内存是这进程创建之初从系统分配的，它所有创建的变量都会存储在这一片内存环境当中

一个是它的上下文环境我们知道进程是运行在操作系统的，那么对于程序来说，它的运行依赖操作系统分配给它的资源，操作系统的一些状态。

在这里插入图片描述
Swoole的进程结构

Swoole的高效不仅仅于底层使用c编写，他的进程结构模型也使其可以高效的处理业务，我们想要深入学习，并且在实际的场景当中使用必须了解，下面我们先看一下结构图
在这里插入图片描述
首先先介绍下swoole的这几种进程分别是干什么的：

1）Master进程：主进程

第一层，Master进程，这个是swoole的主进程,这个进程是用于处理swoole的核心事件驱动的，那么在这个进程当中可以看到它拥有一个MainReactor[线程]以及若干个Reactor[线程]，swoole所有对于事件的监听都会在这些线程中实现，比如来自客户端的连接，信号处理等。

在这里插入图片描述
MainReactor（主线程）

1 主线程会负责监听server socket，如果有新的连接accept，
2 主线程会评估每个Reactor线程的连接数量。
3 将此连接分配给连接数最少的reactor线程，做一个负载均衡。

Reactor线程组

1 Reactor线程负责维护客户端机器的TCP连接、处理网络IO、收发数据
2 完全是异步非阻塞的模式。
3 swoole的主线程在Accept新的连接后，会将这个连接分配给一个固定的Reactor线程，
4 在socket可读时读取数据，并进行协议解析，将请求投递到Worker进程。在socket可写时将数据发送给TCP客户端。

心跳包检测线程（HeartbeatCheck）

1 Swoole配置了心跳检测之后，心跳包线程会在固定时间内对所有之前在线的连接
2 发送检测数据包

UDP收包线程（UdpRecv）

1 接收并且处理客户端udp数据包

2）Manger进程：管理进程

Swoole在运行中会创建一个单独的管理进程，所有的worker进程和task进程都是从管理进程Fork出来的。管理进程会监视所有子进程的退出事件，当worker进程发生致命错误或者运行生命周期结束时，管理进程会回收此进程，并创建新的进程。换句话也就是说，对于worker、task进程的创建、回收等操作全权有“保姆”Manager进程进行管理。

再来一张图梳理下Manager进程和Worker/Task进程的关系。
在这里插入图片描述
3）Worker进程：工作进程

worker 进程属于swoole的主逻辑进程，用户处理客户端的一系列请求，接受由Reactor线程投递的请求数据包，并执行PHP回调函数处理数据生成响应数据并发给Reactor线程，由Reactor线程发送给TCP客户端可以是异步非阻塞模式，也可以是同步阻塞模式。

4）Task进程：异步任务工作进程

taskWorker进程这一进程是swoole提供的异步工作进程，这些进程主要用于处理一些耗时较长的同步任务，在worker进程当中投递过来。

进程查看及流程梳理
当启动一个Swoole应用时，一共会创建2 + n + m个进程，2为一个Master进程和一个Manager进程，其中n为Worker进程数。m为TaskWorker进程数。

默认如果不设置，swoole底层会根据当前机器有多少CPU核数，启动对应数量的Reactor线程和Worker进程。我机器为1核的。Worker为1。

所以现在默认我启动了1个Master进程，1个Manager进程，和1个worker进程，TaskWorker没有设置也就是为0，当前server会产生3个进程。

在启动了server之后，在命令行执行ps -ajft|grep server.php查看当前产生的进程
在这里插入图片描述
这三个进程中，所有进程的根进程，也就是例子中的21915进程，就是所谓的Master进程；而21917进程，则是Manager进程；最后的21919进程，是Worker进程。

swoole事件处理流程
在这里插入图片描述
swoole使用的是reactor事件处理模式，一个请求经历的步骤如下

1 服务器主线程等待客户端连接。
2 Reactor线程处理接连socket，读取socket上的请求数据(Receive)，将请求封装好后投递给work进程。
3 Work进程就是逻辑单元，处理业务数据。
4 Work进程结果返回给Reactor线程。
5 Reactor线程将结果写回socket(Send)。

转载 http://wangzhenkai.com/article/16
参考 https://juejin.im/entry/6844903842404892680

暗夜之中，才见繁星；危机之下，暗藏转机；事在人为，为者常成。