1.（基础）tornado初识

tornado的话就不带着大家看源码了，今后可能会介绍，目前只是看简单的用法，而且当前的tornado版本不高，其实说白了这是很久以前写的文档，但是由于格式的原因，所以打算用Markdown重写一次。下面我们从一个简单的服务看看tornado是怎么启动的。

import tornado.web
'''
tornado基础web框架模块
'''
import tornado.ioloop
'''
tornado的核心循环IO模块，封装了linux的epoll和BSD的kqueue，是tornado高效的基础
'''
import tornado.httpserver
'''
tornado的server模块，用来创建服务端
'''


# 类比django中的视图
# 一个业务处理类,必须继承tornado.web.RequestHandler
class IndexHandler(tornado.web.RequestHandler):
    # 用于处理get请求，不能处理post请求
    def get(self, *args, **kwargs):
        # 对应请求的方法
        # 给浏览器相应信息
        self.write("<h1>欢迎来到古明地觉的避难小屋</h1>")


if __name__ == '__main__':
    # 实例化一个app对象
    # Application，是tornado web框架的核心应用类，是与服务器对应的接口
    # 里面保存了路由映射表，我们可以使用listen方法来创建一个http服务器的实例，并绑定端口
    app = tornado.web.Application([
        (r"/index", IndexHandler)
    ])

    # 绑定监听端口
    '''
    app.listen(8080)
    '''
    # 但是我们还可以用其他的方法
    # 可以手动创建一个服务器，将包含一系列路由映射的app传进去
    # 这和app.listen(8080)是一样的
    # 注意：此时只是绑定了监听端口，但是并没有开启监听
    httpserver = tornado.httpserver.HTTPServer(app)
    httpserver.listen(8080)

    # IOLoop.current()返回了一个IOLoop实例
    # 然后start()启动实例的I/O循环，同时开启监听
    tornado.ioloop.IOLoop.current().start()

执行，然后在浏览器中输入localhost:8080/index

通过访问localhost:8080/index, 界面显示了出来。但是这样有一点不好，就是端口写死了，如果我要是监听其他端口呢？这样写的话，就意味着我每修改一次端口，都要改一次代码。

显然这不具有灵活性，因此我们可以通过命令行来执行程序的时候，将端口传进去，然后用变量接收，tornado也为我们提供了这样一个方法

import tornado.web
import tornado.ioloop
import tornado.httpserver
import tornado.options
'''
专门用来做命令行参数解析以及全局参数的定义，存储，转换
'''

# 定义两个参数
tornado.options.define("port", default=8888, type=int)
tornado.options.define("name_list", default=[], type=str, multiple=True)
'''
函数的原型是：tornado.options.define(name, default=None, type=None, multiple=False)
name：选项的变量名，必须保证唯一性，否则报错"option 'xxx' already defined in ...."
default：默认值，如果不传的话，会使用默认值
type：设置选项变量的类型，会自动进行转换。如果定义的是int，那么会转换成int。
      如果没有设置，那么会根据default的值进行转换，如果default没有设置，那么不转换
multiple：设置选项变量是否为多个值，默认为False，如果想以列表形式接收多个值，那么必须设置此选项为True
'''


# 定义业务处理类，必须要继承自tornado.web下的RequestHandler
class IndexHandler(tornado.web.RequestHandler):

    def get(self, *args, **kwargs):
        self.write("多睡觉，少操心")
        print(tornado.options.options.name_list)


if __name__ == '__main__':
    # 转换命令行参数，然后会自动将输入的参数保存到tornado.options.options中
    tornado.options.parse_command_line()
    app = tornado.web.Application([
        (r"/index", IndexHandler)
    ])
    httpserver = tornado.httpserver.HTTPServer(app)
    # 所有的参数都在tornado.options.options下
    # 这和optparse类似，算是一个属性，通过.来访问
    httpserver.listen(tornado.options.options.port)
    '''
    其实httpserver.listen()，也可以分为两步
    (1) httpserver.bind(port), 将服务器绑定到指定的端口
    (2) httpserver.start(num), 默认开启一个进程，值大于0，创建对应个数个子进程，小于0，创建对应cpu核心数的子进程
    所以这算是一种开启多进程的方式，但是出于一些原因，我们不建议这么用，而是手动开启多个进程，原因有三：
    1.每个子进程都会从父进程中复制一份IOLoop实例，如果创建子进程之前修改了IOLoop，会影响所有的子进程
    2.所有的进程都是由一个命令启动的，无法做到在不停止服务的情况下修改代码
    3.所有进程共享一个端口，想要分别监控很困难
    '''
    tornado.ioloop.IOLoop.current().start()

通过命令行开启服务

在浏览器中输入localhost:8888/index

得到界面如下，同时也打印了name_list

除了从命令行解析参数，还可以从配置文件当中解析，使用函数tornado.options.parse_config_file("config_file")，其他的用法一样。
并且配置文件的书写格式仍然要按照python语法要求，不支持字典类型。
无论是使用从命令行解析还是从配置文件中解析，tornado都会默认开启logging功能，向屏幕终端打印一些信息，如果想关闭日志
可以在命令行当中加上--logging=None，或者在代码中加入tornado.options.options.logging = None
但是实际情况这两种方法，我们都不推荐，因为比较麻烦，最好的方式是将端口等信息写在一个py文件里，然后从py文件里面读取，这样的话只需要修改py文件即可

导入config.py文件，然后使用config.options["port"]即可

此外补充一点：为什么app.listen(8080)和httpserver = tornado.httpserver.HTTPServer(app), httpserver.listen(8080)是一样的，我们可以看一下源码

看到这里，基础流程应该大致都了解了，那么我们的代码结构也要改一改了
显然我们这里所有的代码都写在一个文件里，如果对应的handler变多，那么把所有代码都写在一个py文件里显然是非常非常不好的，况且还有配置文件，html模板，css，js等等。
因此我们必须要分级，可以将之前的代码改写一下

views/view.py

import tornado.web

class IndexHandler(tornado.web.RequestHandler):
    def get(self, *args, **kwargs):
        self.write('<h1 style="text-align: center">my name is satori</h1>')

application.py

import tornado.web
from views import view
import config

# 我们可以自定义一个Application，但是要继承tornado.web下的Application
class Application(tornado.web.Application):
    def __init__(self):
        # 进行路由映射，导入views下的view
        # 不同的业务肯定有不同的view，我们这里就只创建一个view
        handlers = [
            (r"/index", view.IndexHandler)
        ]

        # 我们自己定义的handler最终肯定要交给父类去执行一下
        # 同时将我们config下的settings使用**打散，传进去
        super(Application, self).__init__(handlers=handlers, **config.settings)

config.py

options = {"port": 7777}

# 这里的settings，后面再说,先随便传一个
settings = {"aa": "bb"}

start.py

import tornado.ioloop
import tornado.httpserver
from application import Application
import config

app = Application()
server = tornado.httpserver.HTTPServer(app)
server.listen(config.options["port"])

tornado.ioloop.IOLoop.current().start()

可以看到，这与我们之前写在一个py文件里面的内容基本上一样的，但是我们很好地将各个部分进行了分离，不同的部分放在了不同的py文件里。像view，当我们建立网站的内容比较多的时候，所有的业务对应的handler写在一个view文件里也不好。因此定义一个views文件夹，里面存放多个view，每一个业务对应一个view。

然后执行start，也就是启动文件

可以看到开启服务是没有问题的
而且像django或者golang里的beego框架一样，调用命令创建项目的时候，框架会直接帮你创建好相应文件夹和文件。以后我们创建tornado项目，便也可以按照这种模式，手动创建相应文件夹，每个部分完成每个部分的功能。
各个部分之间分离，不会受到彼此的影响。config写配置，views写handler，也就是业务处理逻辑，application则是写路由映射关系，static则是静态文件，templates是模板，而最后的start则是启动文件，将其他的模块导入进来，然后启动。

最后还有一个小插曲，关于tornado的原理，tornado的高性能主要来源于两方面，一个是基于epoll的IO多路复用，另一个是异步。异步以后再说，先来看看tornado的IO多路复用

首先tornado封装了epoll，这个epoll就相当于是我们的管家。首先创建一个socket，这个socket只是用来监听新链接的到来，不做请求处理。当一个新链接过来时，会专门创建一个与之交互的socket，同时将监听的socket所获取的链接移到新创建的socket上面。
然后用于监听的socket继续监听，每当新来一个链接就创建一个socket与之进行交互。socket建好了，但是对方不一定就发了请求。
于是管家epoll就不断地循环监听这些socket，而我们的IOLoop是全局总调度器，它不用去亲自去监听是否有活跃的socket，因为管家epoll已经帮忙做了。
那么IOLoop的任务就是不断地问epoll，有没有活跃的socket。就这样不停地询问，直到epoll说有了，然后便将获取到的请求进行路由映射，找到对应的handler，执行相应的业务逻辑。