线程池进程池协程io模型

一、线程池与进程池

　　什么是池？简单的说就是一个容器，一个范围

　　　在保证计算机硬件安全的情况下最大限度的充分利用计算机，

池其实是降低了程序的运行效率，但是保证了计算机硬件的安全，也是实现了一个并发的效果，现如今硬件的发展跟不上软件的更新速度

进程池与线程池

　　开进程开线程都需要消耗资源，只不过两者比较的情况线程消耗的资源比较少

　　创建进程池：multiprocess.Pool模块

导入的写法：from concurrent.futures import  ThreadPoolExecutor,ProcessPoolExecutor

　Pool([numprocess  [,initializer [, initargs]]]):创建进程池

1 numprocess:要创建的进程数，如果省略，将默认使用cpu_count()的值
2 initializer：是每个工作进程启动时要执行的可调用对象，默认为None
3 initargs：是要传给initializer的参数组

方法有：p.apply() p.apply_async() p.colse() p.join()

内置函数 pool =ProcessPoolExecutor() # 创建进程池，不写默认为当前计算机cpu的个数

1、进程池的用法：

from concurrent.futures import  ThreadPoolExecutor,ProcessPoolExecutor
import time
import os

"""
池子中创建的进程/线程创建一次就不会再创建了
开始到结尾都是那么几个，最初定义的
这样的话节省了反复开辟进程/线程的资源

"""

#进程池的用法：
pool =ProcessPoolExecutor() # 创建进程池，不写默认为当前计算机cpu的个数

def task(n):
    print(n,os.getpid()) # 查看当前的进程号
    time.sleep(2)
    return  n**2

def call_back(n):
    print("异步提交任务的返回结果：",n.result())

"异步回调机制:当异步提交的任务有返回结果之后，会自动触发回调函数的执行"
if __name__ == '__main__':
    l_list = []
    for i in range(20):
        res = pool.submit(task,i).add_done_callback(call_back) # 异步回调
        "提交任务的时候 绑定一个回调函数 一旦该任务有结果 立刻执行对于的回调函数"
        l_list.append(res)

>>>>

0 16128
1 41700
2 24856
3 9876
4 41128
5 40068
6 19288
7 40080
8 16128
异步提交任务的返回结果： 0
9 41700
异步提交任务的返回结果： 1
10 24856
异步提交任务的返回结果： 4
11 9876

进程池的回调机制

2、创建线程池：

线程池的用法

from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
import time
import os

pool =ThreadPoolExecutor(5) # 括号内可以传参数指定线程池内的线程个数
# 也可以不传，不传就默认为当前所在技算机的cpu个数乘以5

def task(n):
    print(n,os.getpid())
    time.sleep(2)
    return  n **2

t_list=[]
for i in range(20):
    res=pool.submit(task,i) # 往线程池中提交任务  异步提交
    # print(res.result()) # 原地等待任务的返回结果 异步
    t_list.append(res)

pool.shutdown() # 关闭池子 等待池子中所有的任务执行完毕之后 才会往下运行代码
for p in t_list:
    print(">>>>:",p.result())


>>>:

18 32864
19 32864
>>>>: 0
>>>>: 1
>>>>: 4
>>>>: 9
>>>>: 16
>>>>: 25
>>>>: 36

二、协程

（是程序员想象出来的，就是单线程实现并发的情况下可以称为协程）

1、单线程实现并发在应用程序里控制多个任务的切换+保存的状态

优点：应用程序级别速度要远远高于操作系统的切换

缺点：多任务一旦有一个阻塞没有切，整个线程都阻塞在原地，该线程内的其他任务都不能执行了

进程：资源单位
线程：执行单位
协程：单线程下实现并发

并发的条件：多道技术：空间上的应用，时间上的复用（切换+保存）

2、协程序的目的：
    想要在单线程下实现并发
    并发指的是多个任务看起来是同时运行的
    并发=切换+保存状态

#串行执行
import time

def func1():
    for i in range(10000000):
        i+1

def func2():
    for i in range(10000000):
        i+1

start = time.time()
func1()
func2()
stop = time.time()  #1.094691514968872
print(stop - start)


#基于yield并发执行  有yield在函数内，加括号调用时变成生成器
import time
def func1():
    while True:
        yield

def func2():
    g=func1()
    for i in range(10000000):
　　
        i+1
        next(g)

start=time.time()
func2()
stop=time.time() # 1.3715009689331055
print(stop-start)

　：第一种情况的切换。在任务一遇到io情况下，切到任务二去执行，这样就可以利用任务一阻塞的时间完成任务二的计算，

（在运行和就绪态来回切换，等待阻塞的事件很短）效率的提升就在于此。

一旦遇到IO自己通过代码切换
给操作系统的感觉是你这个线程没有任何的IO
ps:欺骗操作系统让它误认为你这个程序一直没有IO
从而保证程序在运行态和就绪态来回切换
提升代码的运行效率　

3、实现了切换+保存的状态就一定能够提升效率吗？

这也分情况来讨论的：当任务是io密集型的情况下效率是提升的

当任务是计算密集型的情况下效率反而降低了

执行效率最好，更节省资源的应该是：多进程下开多线程，多线程下再开协程

4、用yeild 只能够保持切换的状态（yield 保存上一次的结果），需要找到一个能识别io的工具从而引入了 gevent 模块

　　Gevent 是一个第三方库，可以轻松通过gevent实现并发同步或异步编程，在gevent中用到的主要模式是Greenlet, 它是以C扩展模块形式接入Python的轻量级协程。

swpn( ) 用于监测I/O 操作实现切换＋保存的状态在单线程下实现并发的效果

swpn() 内置封装自带return 有返回值

from gevent import monkey;monkey.patch_all()
# 由于该模快经常被使用，建议这么写
from gevent import spawn
import  time

#注意gevent模块没办法自动识别time.sleep等io情况
# 需要你手动再配置一个参数

def heng():
    print("天时地利")
    time.sleep(2)
    print("只前东风")

def hei():
    print("登高望楼")
    time.sleep(2)
    print("独坐西楼")
def haha():
    print('who are you ')
    time.sleep(2)
    print('why')

start = time.time()
g1= spawn(heng) # spawn会检测所有的任务
g2 = spawn(hei)
g3 = spawn(haha)

g1.join()
g2.join()
g3.join()

print(time.time()-start)

用spawn 检测掠过io 快速的切换+保存的状态让系统误认为没有一个io的操作，提升执行的效率

5、利用单线程形式实现ftp的并发效果

　　利用genvent模块下的spawn() 自动检测io操作的功能实现

　　FTP客户端：

import socket
from threading import Thread,current_thread

def client(): # 写成函数版
    client = socket.socket()
    client.connect(('127.0.0.1',8080))
    n = 0
    while True:

        data = '%s %s'%(current_thread().name,n)
        client.send(data.encode('utf-8'))
        res = client.recv(1024)
        print(res.decode('utf-8'))
        n += 1

for i in range(400):
    t = Thread(target=client)
    t.start()

FTP服务端：

from gevent import monkey;monkey.patch_all()
import socket
from gevent import spawn

server = socket.socket()
server.bind(('127.0.0.1',8080))
server.listen(5)

def talk(conn):
    while True:
        try:
            data = conn.recv(1024)
            if len(data) == 0:break
            print(data.decode('utf-8'))
            conn.send(data.upper())
        except ConnectionResetError as e:
            print(e)
            break
    conn.close()

def server1():
    while True:
        conn, addr = server.accept()
        spawn(talk,conn)  # 自定检测io操作，在通讯和接受之间，快速实现切换+保存的状态，时间间隔很短，看起来就像是在并发

if __name__ == '__main__':
    g1 = spawn(server1)
    g1.join()

三、IO模型

为了更好地了解IO模型，我们需要事先回顾下：同步、异步、阻塞、非阻塞

Stevens在文章中一共比较了五种IO Model：

　* blocking IO 阻塞IO
    * nonblocking IO 非阻塞IO
    * IO multiplexing IO多路复用
    * signal driven IO 信号驱动IO
    * asynchronous IO 异步IO

同步异步:指的是运行的任务的提交方式:

　　同步:提交的任务之后原地等待任务的返回结果,期间不做任何事

　　异步：提交任务后立刻执行下一行代码，不等待任务的返回结果，采用异步回调机制

阻塞与非阻塞:指的是程序的运行状态

　　阻塞：阻塞等待的状态

　　非阻塞：就绪态或者运行态