[phvia/firman] PHP多进程服务器模型中的惊群

[ 典型场景 ]

典型的多进程服务器模型是这样的,主进程绑定ip,监听port,fork几个子进程,子进程安装信号处理器,随后轮询资源描述符检查是否可读可写;

子进程的轮询又涉及到 IO复用,accept连接,事件处理 系列操作。

以下用伪码表示这个过程:

Master: bind -> listen -> fork {
  // Child 
  install signal
  select loop
  accept connection
  event callback
} -> monitor

[ 存在缺陷 ]

主进程监听port,存在惊群问题,客户端连接请求到来时,所有子进程被唤醒,尝试接受连接,但只有一个连接成功,其余产生EAGAIN错误,并继续进入轮询。

通过 strace -p pid 可以看到空闲进程的执行过程:

$ select(7, [6], [6], [], {5, 0}) = 0 (Timeout)
$ select(7, [6], [6], [], {5, 0}) = 1 (in [6], left {2, 22060})
$ poll([{fd=6, events=POLLIN|POLLERR|POLLHUP}], 1, 10000) = 1 ([{fd=6, revents=POLLIN}])
$ accept(6, 0x7ffe34ffe390, 0x7ffe34ffe380) = -1 EAGAIN (Resource temporarily unavailable)
$ poll([{fd=6, events=POLLIN|POLLERR|POLLHUP}], 1, 10000) = 0 (Timeout)
$ select(7, [6], [6], [], {5, 0}) = 0 (Timeout)

可想而知,当子进程数量较多时,进程调度(上下文切换)需要耗费的资源非常多。

[ 解决方式 ]

在PHP7,启用 socket 的 so_reuseport 选项之后,子进程就可以在每个端口上监听了,有连接时才被唤醒。
以下用伪码表示这个过程:

Master: fork {
    // Child 
    install signal
    bind
    listen
    select loop
    accept connection
    event callback
} -> monitor

[ 框架应用 ]

phvia/firmanhttps://github.com/phvia/firman/commit/bace0b2ffda915cc8cf5c73dc009d78a215637d3

Link:http://www.cnblogs.com/farwish/p/8747314.html

原文地址:https://www.cnblogs.com/farwish/p/8747314.html