day21&22&23：线程、进程、协程

1、程序工作原理

进程的限制：每一个时刻只能有一个线程来工作。
多进程的优点：同时利用多个cpu，能够同时进行多个操作。缺点：对内存消耗比较高
当进程数多于cpu数量的时候会导致不能被调用，进程不是越多越好，cpu与进程数量相等最好
线程：java和C# 对于一个进程里面的多个线程，cpu都在同一个时刻能使用。py同一时刻只能调用一个。
so：对于型的应用，py效率较java C#低。
多线程优点：共享进程的内存，可以创造并发操作。缺点：抢占资源，
多线程得时候系统在调用的时候需要记录请求上下文的信息，请求上下文的切换这个过程非常耗时。因此线程不是越多越好，具体案例具体分析。
在计算机中，执行任务的最小单元就是线程
IO操作不利用CPU，IO密集型操作适合多线程，对于计算密集型适合多进程
GIL：全局解释器锁，PY特有它会在每个进程上加个锁
系统存在进程和线程的目的是为了提高效率
1.1、单进程单线程
1.2、自定义线程：
主进程
主线程
子线程
2、线程锁 threading.RLock和threading.Lock

多线程修改一个数据得时候可能会造成咱数据。建议使用rlock

3、线程时间：threading.Event: 通知
当有进程间的通讯的情况下这个才有应用场景。汽车类比线程，Event.wait()红灯，Event.set()绿灯，Event.clear():使红灯变绿

even是线程间的通讯机制。Event.wait([timeout]):赌赛线程，知道event对象内部标示位被设置为True或超时时间。Event.set()：将标识位设为True。Event.clear():标识位设为False。Event.isSet():判断标识位是否为True。

4、queue模块：生产者-消费者模型

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import queue
import threading
# import queue

# q = queue.Queue(maxsize=0)  # 构造一个先进显出队列，maxsize指定队列长度，为0 时，表示队列长度无限制。
#
# q.join()    # 等到队列为空的时候，在执行别的操作
# q.qsize()   # 返回队列的大小 （不可靠）
# q.empty()   # 当队列为空的时候，返回True 否则返回False （不可靠）
# q.full()    # 当队列满的时候，返回True，否则返回False （不可靠）
# q.put(item, block=True, timeout=None) #  将item放入Queue尾部，item必须存在，可以参数block默认为True,表示当队列满时，会等待队列给出可用位置，
# # 　　　　　　　　　　　　　　　　　　　　　　　　 为False时为非阻塞，此时如果队列已满，会引发queue.Full 异常。 可选参数timeout，表示 会阻塞设置的时间，过后，
# # 　　　　　　　　　　　　　　　　　　　　　　　　  如果队列无法给出放入item的位置，则引发 queue.Full 异常
# q.get(block=True, timeout=None) #   移除并返回队列头部的一个值，可选参数block默认为True，表示获取值的时候，如果队列为空，则阻塞，为False时，不阻塞，
# # 　　　　　　　　　　　　　　　　　　　　　　若此时队列为空，则引发 queue.Empty异常。 可选参数timeout，表示会阻塞设置的时候，过后，如果队列为空，则引发Empty异常。
# q.put_nowait(item) #   等效于 put(item,block=False)
# q.get_nowait() #    等效于 get(item,block=False)



message = queue.Queue(10)

def producer(i):
    print("put:",i)
    # while True:
    message.put(i)

def consumer(i):
    # while True:
    msg = message.get()
    print(msg)

for i in range(12):
    t = threading.Thread(target=producer, args=(i,))
    t.start()

for i in range(10):
    t = threading.Thread(target=consumer, args=(i,))
    t.start()
qs = message.qsize()
print("当前消息队列的长度为:%d"%(qs))
print("当前消息队列的长度为:",qs)

queue示例代码

join()方法主线程等待，最多等待时间可以hi设置，eg：t.join(2)

    import threading
    def f0():
        pass
    def f1(a1,a2)：
        time.sleep(10)
        f0()
    t = threading.Thread(target=f1,args(111,222,))
    
    t.setDaemon(True)  #默认false 主线程将等待执行完成后结束，设置为true后主线程将不在等待
    t.start()
    t = threading.Thread(target=f1,args(111,222,))
    t.start()
    t = threading.Thread(target=f1,args(111,222,))
    t.start()
    t = threading.Thread(target=f1,args(111,222,))

t.start()

threading demo

5、进程：multiprocess是py进程模块

进程之间默认是隔离得，线程的资源默认是共享的

两个进程共享数据需要使用特殊得对象： array:其他语音或manager.dict()

进程不是，越多越好，建议使用线程池来控制。

#!/usr/bin/env python
# -*- coding:utf-8 -*-
from multiprocessing import Pool
import time
def myFun(i):
    time.sleep(2)
    return i+100

def end_call(arg):
    print("end_call",arg)


# print(p.map(myFun,range(10)))
if __name__ == "__main__":
    p = Pool(5)

    for i in range(10):
        p.apply_async(func=myFun,args=(i,),callback=end_call)

    print("end")
    p.close()
    p.join()

porcesspooldemo

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from multiprocessing import  Pool
import time

def f1(a):
    time.sleep(1)
    print(a)
    return 1000
def f2(arg):
    print(arg)

if __name__ =="__main__":
    pool = Pool(5)

    for i in range(50):
        pool.apply_async(func=f1, args=(i,),callback=f2)
        # pool.apply(func=f1, args=(i,))
        print('<<=================>>')
    pool.close()
    pool.join()

processpooldemo2

6、线程池py没有提供，我们需要自己编写

简单线程池示例：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import queue
import threading
import time

class ThreadPool(object):

    def __init__(self, max_num=20):
        self.queue = queue.Queue(max_num)
        for i in range(max_num):
            self.queue.put(threading.Thread)

    def get_thread(self):
        return self.queue.get()

    def add_thread(self):
        self.queue.put(threading.Thread)

def func(pool,a1):
    time.sleep(2)
    print(a1)
    pool.add_thread()

p = ThreadPool(10)

for i in range(100):
    #获得类
    thread = p.get_thread()
    #对象 = 类（）
    #
    t = thread(target=func,args=(p,i,))
    t.start()
"""
pool = ThreadPool(10)

def func(arg, p):
    print arg
    import time
    time.sleep(2)
    p.add_thread()

for i in xrange(30):
    thread = pool.get_thread()
    t = thread(target=func, args=(i, pool))
    t.start()
"""

# p = ThreadPool()
# ret = p.get_thread()
#
# t = ret(target=func,)
# t.start()

View Code

复杂的线城池示例：

#!/usr/bin/env python
# -*- coding:utf-8 -*-

import queue
import threading
import contextlib
import time

StopEvent = object()


class ThreadPool(object):

    def __init__(self, max_num, max_task_num = None):
        if max_task_num:
            self.q = queue.Queue(max_task_num)
        else:
            self.q = queue.Queue()
         # 多大容量
        self.max_num = max_num
        self.cancel = False
        self.terminal = False
        # 真实创建的线程列表
        self.generate_list = []
        # 空闲线程数量
        self.free_list = []

    def run(self, func, args, callback=None):
        """
        线程池执行一个任务
        :param func: 任务函数
        :param args: 任务函数所需参数
        :param callback: 任务执行失败或成功后执行的回调函数，回调函数有两个参数1、任务函数执行状态；2、任务函数返回值（默认为None，即：不执行回调函数）
        :return: 如果线程池已经终止，则返回True否则None
        """
        if self.cancel:
            return
        if len(self.free_list) == 0 and len(self.generate_list) < self.max_num:
            self.generate_thread()
        w = (func, args, callback,)
        self.q.put(w)

    def generate_thread(self):
        """
        创建一个线程
        """
        t = threading.Thread(target=self.call)
        t.start()

    def call(self):
        """
        循环去获取任务函数并执行任务函数
        """
        # 获取当前进程
        current_thread = threading.currentThread()
        self.generate_list.append(current_thread)

        # 取任务
        event = self.q.get()
        while event != StopEvent:
            # 是元组=》是任务
            # 解开任务包
            # 执行任务

            func, arguments, callback = event
            try:
                result = func(*arguments)
                success = True
            except Exception as e:
                success = False
                result = None

            if callback is not None:
                try:
                    callback(success, result)
                except Exception as e:
                    pass

            with self.worker_state(self.free_list, current_thread):
                if self.terminal:
                    event = StopEvent
                else:
                    event = self.q.get()
        else:

            # 不是元组，不是任务
            # 标记：我空闲了
            # 执行后线程死掉
            self.generate_list.remove(current_thread)

    def close(self):
        """
        执行完所有的任务后，所有线程停止
        """
        self.cancel = True
        full_size = len(self.generate_list)
        while full_size:
            self.q.put(StopEvent)
            full_size -= 1

    def terminate(self):
        """
        无论是否还有任务，终止线程
        """
        self.terminal = True

        while self.generate_list:
            self.q.put(StopEvent)

        self.q.empty()

    @contextlib.contextmanager
    def worker_state(self, state_list, worker_thread):
        """
        用于记录线程中正在等待的线程数
        """
        state_list.append(worker_thread)
        try:
            yield
        finally:
            state_list.remove(worker_thread)



# How to use


pool = ThreadPool(5)

def callback(status, result):
    # status, execute action status
    # result, execute action return value
    pass


def action(i):
    print(i)

for i in range(30):
    #将任务放在队列
    #着手开始处理任务
    #创建线程（有空闲线程则不创建；不高于线程池的限制；根据任务个数判断）  =》线程去队列中去任务
    ret = pool.run(action, (i,), callback)

time.sleep(5)
print(len(pool.generate_list), len(pool.free_list))
print(len(pool.generate_list), len(pool.free_list))
# pool.close()
# pool.terminate()

View Code

7、上下文管理：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import  queue
import  contextlib
"""
q = queue.Queue()
li = []

# li.append(1)
# q.get()
# li.remove(1)

@contextlib.contextmanager
def worker_stater(xxx,val):
    xxx.append(val)
    try:
        yield 123
    finally:
        xxx.remove(val)

q.put("john")
with worker_stater(li,1) as f:
    print('before',li)
    print(f)
    q.get()
    pass
    pass

print('after',li)
"""

@contextlib.contextmanager
def myopen(file_path,mode):
    f = open(file_path,mode,encoding='utf-8')
    try:
        yield  f
    finally:
        f.close()

with myopen('index.html','r') as file_obj:
    print(file_obj.readline())

demo

8、协程：

协程主要应用在IO密集型场景，由程序来控制，也叫微线程，高性能通常与协程挂钩

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import  gevent

def foo():
    print('Running in foo')
    gevent.sleep(0)  #切换协程
    print('Explicit context switch to foo agein')
def bar():
    print('Running in bar')
    gevent.sleep(0)  #切换协程
    print('Explicit context switch back to bar agein')

gevent.joinall([
    gevent.spawn(foo),
    gevent.spawn(bar),
])

demo1

#!/usr/bin/env python
# -*- coding:utf-8 -*-
from gevent import  monkey;monkey.patch_all()
import  gevent
import  requests

def f(url):
    print('GET:%s' % url)
    resp = requests.get(url)
    data = resp.text
    print(url,len(data))

gevent.joinall([
    gevent.spawn(f,'http://www.python.org/'),
    gevent.spawn(f,'https://www.yahoo.com/'),
    gevent.spawn(f,'https://github.com/'),
])

demo2

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from greenlet import  greenlet

def test1():
    print(12)
    gr2.switch()
    print(34)
    gr2.switch()

def test2():
    print(56)
    gr1.switch()
    print(78)
    gr1.switch()

gr1 = greenlet(test1)
gr2 = greenlet(test2)

gr1.switch()

demo3

end