twisted的defer模式和线程池

前言:
　　最近帮朋友review其模块服务代码, 使用的是python的twisted网络框架. 鉴于之前并没有使用过, 于是决定好好研究一番.
　　twisted的reactor模型很好的处理了网络IO事件, 以及定时任务触发. 但包处理后的业务逻辑操作, 需要根据具体的场景来决定.
　　本文将讲述twisted如何实现half-sync/half-async的模式, 其线程池和defer模式是如何设计和使用的.

场景构造:
　　twisted服务接受业务请求, 后端需要访问mysql. 由于mysql的接口是同步的, 如果安装twisted默认的方式处理话, 其业务操作(mysql)会阻塞reactor的IO事件循环. 这大大降低了twisted的服务能力.
　　为了解决该类问题, twisted支持线程池. 把业务逻辑和IO事件分离, IO操作依旧是异步的, 而业务逻辑则采用线程池来处理.

工作线程池:
　　在具体讲述defer模式之前, 先谈谈reactor自带的线程池, 这也符合使用half-sync/half-async模式的直观理解.
　　先来构造下一个基础样例代码:

#! /usr/bin/python
#-*- coding: UTF-8 -*-

from twisted.internet import reactor
from twisted.internet import protocol
from twisted.protocols.basic import LineReceiver

import time

class DemoProtocol(LineReceiver):
               
    def lineReceived(self, line):
        # 进行数据包的处理
        reactor.callInThread(self.handle_request, line)
    
    def handle_request(self, line):
        """
            hanlde_request:
                进行具体的业务逻辑处理 
        """
        # 边使用sleep(1)来代替模拟
        time.sleep(1)
        # 借助callFromThread响应结果
        reactor.callFromThread(self.write_response, line)
    
    def write_response(self, result):
        self.transport.write("ack:" + str(result) + "
")

class DemoProtocolFactory(protocol.Factory):
    def buildProtocol(self, addr):
        return DemoProtocol()
    

reactor.listenTCP(9090, DemoProtocolFactory())
reactor.run()

　　DemoProtocol在收到一行消息, 需要处理一个业务需耗时一秒, 于是其调用callInThread来借助reactor的线程池来执行.
　　其callInThread的函数定义如下:

    def callInThread(self, _callable, *args, **kwargs):
            self.getThreadPool().callInThread(_callable, *args, **kwargs)

　　从中, 我们可以印证之前的观点, 借助线程池来完成耗时阻塞的业务工作.
　　再来看一下callFromThread的函数定义:

    def callFromThread(self, f, *args, **kw):
            assert callable(f), "%s is not callable" % (f,)
            self.threadCallQueue.append((f, args, kw))
            self.wakeUp()

　　其作用是把回调放入主线程(也是reactor主事件循环)的待执行队列中, 并及时唤醒reactor.
　　我们把写入响应的操作放入主循环中, 是为了让IO集中在主循环中进行, 避免潜在的线程不安全的问题.

defer模式:
　　直接使用reactor的线程池, 非常容易实现half-sync/half-async的模式, 也让IO和业务逻辑隔离. 但reactor设计之初, 更倾向于隐藏其内部的线程池. 于是其引入了defer模式.
　　让我们实现与上等同的代码片段:

#! /usr/bin/python
#-*- coding: UTF-8 -*-

from twisted.internet import reactor
from twisted.internet import protocol
from twisted.protocols.basic import LineReceiver
from twisted.internet.threads import deferToThread

import time

class DemoProtocol(LineReceiver):
               
    def lineReceived(self, line):
        # 进行数据包的处理
        deferToThread(self.handle_request, line).addCallback(self.write_response)
    
    def handle_request(self, line):
        """
            hanlde_request:
                进行具体的业务逻辑处理 
        """
        # 边使用sleep(1)来代替模拟
        time.sleep(1)
        return line
    
    def write_response(self, result):
        self.transport.write("ack:" + str(result) + "
")
    

class DemoProtocolFactory(protocol.Factory):
    def buildProtocol(self, addr):
        return DemoProtocol()
    

reactor.listenTCP(9090, DemoProtocolFactory())
reactor.run()

　　使用defer后, 代码更加的简洁. 其defer对象, 其实借用了线程池.
　　threads.deferToThread定义如下:

def deferToThread(f, *args, **kwargs):
    from twisted.internet import reactor
    return deferToThreadPool(reactor, reactor.getThreadPool(),
                             f, *args, **kwargs)

def deferToThreadPool(reactor, threadpool, f, *args, **kwargs):
    d = defer.Deferred()

    def onResult(success, result):
        if success:
            reactor.callFromThread(d.callback, result)
        else:
            reactor.callFromThread(d.errback, result)

    threadpool.callInThreadWithCallback(onResult, f, *args, **kwargs)

    return d

　　这边我们可以发现deferToThread, 就是间接调用了callInThread函数, 另一方面, 对其回调函数的执行结果, 进行了onCallback, 以及onErrback的调用. 这些回调函数在主线程中运行.
　　defer模式简化了程序编写, 也改变了人们开发的思维模式.

测试回顾:
　　使用telnet进行测试, 结果正常.
　　
　　另一方面, twisted的线程池, 其默认是采用延迟初始化的方式.
　　服务开启时, 只有主线程一个, 随着请求的到来, 其按需产生更多的worker thread.
　　而其线程池默认为10. 我们可以借助suggestThreadPoolSize方法来修改.

写在最后：
　　如果你觉得这篇文章对你有帮助, 请小小打赏下. 其实我想试试, 看看写博客能否给自己带来一点小小的收益. 无论多少, 都是对楼主一种由衷的肯定.