day38 各种队列、Event事件、协程、猴子补丁

1、各种队列

我们已经学习了队列这种存取值的方法,我们以前使用的队列是可以进行进程间通信的(IPC),但是今天学习的这两种队列是不能进行进程间通信的,只能进行线程间的通信

这两种队列分别是先进后出式队列Lifoqueue、优先级队列PriorityQueue

from queue import LifoQueue
​
lf = LifoQueue()
lf.put(111)
lf.put(222)
lf.put(333)
​
print(lf.get())
print(lf.get())
print(lf.get())
​
# 333
# 222
# 111
# 取值规则为先进后出
from queue import PriorityQueue
​
pq = PriorityQueue()
pq.put((1,2))
pq.put((1,3))
pq.put((1,4))
​
print(pq.get())
print(pq.get())
print(pq.get())
​
# (1,2)
# (1,3)
# (1,4)
# 规则是按照优先级进行对比,会先对比容器中的第一个元素,如果第一个一样则对比第二个元素,直至排出优先级
# 最高的那个元素

扩展知识: 大小比较的本质

关于为什么有的对象可以进行大小的比较,有的对象不能进行大小的比较

https://blog.csdn.net/zhangshuaijun123/article/details/82149056

2、Event事件

import time
from threading import Event, Thread
​
event = Event()
​
flag = False
​
def sever():
    print("正在开启服务器...")
    time.sleep(3)
    print("服务器开启成功")
    # global flag
    # flag = True
    event.set()
​
​
def client():
    # print("正在连接...")
    # if flag:
    event.wait()
    print("连接成功")
    # else:
    #     print("连接失败")
# 假如我们想要在 服务器开启成功后在进行连接,用这种办法肯定不行,那么就需要在开启成功后添加一个标志,
# 只有在标志修改后直接进行后续步骤
# event就可以创建这种标志
​
t = Thread(target=sever)
t1 = Thread(target=client)
t.start()
t1.start()
​
print("over")

Event事件的作用是进行进程间通讯,将进程间进行状态的同步,我们可以在某个点设置event.set(),那么当其前方代码执行完毕后,就会发出一个信号,使得event.wait()方法不再阻塞,进而执行wait()之后的代码

 

3、协程

在我们使用多线程实现并发的过程中,如果并发量比较大,那么我们应该如何处理?

此时你可能会说开启多线程,但是如果并发量达到了百万或者千万级别,那应该如何呢?

此时使用多线程不可能实现,但是如果使用多进程+多线程可以进行处理,但是如果更多呢?

因为进程以及线程的开启数量是有限的,如果开启过多可能会造成系统不稳定,那么此时可以使用我们今天使用的内容 —— 协程

学习协程之前我们首先需要复习一下什么是并发,并发指的是在同一个时间段,看起来有几个进程在同时运行,但是实际上同一时间只有一个线程在执行,我们以前学了多线程实现并发,那么一个线程可不可以实现并发呢?

首先来看一下我们已经学过的生成器

import time
​
def func():
    a = 1
    for i in range(100000000):
        a += 1
        # yield
​
​
def func2():
    # s = func()
    a = 1
    for i in range(100000000):
        a += 1
        # next(s)
​
​
st = time.time()
func()
func2()
print(time.time() - st)
# 在使用串行执行时,耗时为15秒,在使用生成器时,耗时为30秒

我们通过上述生成器的例子可以看出,在同一个进程中可以同时并发的执行两个函数,这已经实现了并发,但是,在上述例子中,并发虽然实现了,但是程序的执行效率却一点都没有提高,反而执行效率都降低了,

上述的例子,我们进行的都是数据的计算,那么如果我们将数据的计算换成IO操作呢?

可能你会想,实现IO操作也不行啊,因为即使达到了并行的效果,但是我们的程序在执行到IO操作时,还是会等待,只有在IO操作执行完毕才会进行后续的取值工作,这时候还是在进行等待,而且我们在进行多个函数之间的切换时,要写好多next取值的代码,整体逻辑也不清晰,那么有没有一种方法对这些进行了改变呢?

我们烦恼的问题,前人也遇到了,而且他们也进行了处理,有一个包叫做gevent,他可以帮我们处理这些烦人的问题

from gevent import monkey
monkey.patch_all()
​
import time
import gevent
​
​
​
def func():
    print("func1 run")
    time.sleep(3)
    print("func1 over")
​
def func2():
    print("func2 run")
    time.sleep(5)
    print("func2 over")
​
​
g1 = gevent.spawn(func)
g2 = gevent.spawn(func2)
​
gevent.joinall([g1,g2])

使用这个包可以将我们烦恼的问题全部解决,首先是进行等待的问题,在使用这个包进行单线程并发时,当一个函数遇到了IO操作,这个方法不会进行等待,而是直接切换到其他方法继续执行,因为对于操作系统来说最小的执行单位是线程,所以一个线程如果不进行IO操作,那么只有在这个时间片用完之后在进行进行切换,直接提高了我们使用CPU的时间,当我们使用gevent进行单线程并发时,如果遇到IO就切换到同线程下的其它函数进行执行,那么操作系统就不会将CPU切走,进而提高我们的程序对于CPU的使用

那么这个模块是如何实现这个不等待直接切换执行呢?

因为在这些IO操作中大部分都封装了不等待的方法,当时这些方法默认时开启的,如果设置为False,那么这些模块在进行执行时如果遇到了这些要进行IO操作,如果没有值就会报错,那么再将这些错误进行捕捉,再在except中进行切换就可以了

与此同时,新的疑问出现了,他是怎么将系统中的错误进行捕捉的呢?在我们的代码中并没有对这些错误进行处理,而且我们只是将这些函数作为参数传递给了这个模块进行执行

当我们将其中的monkey.patch_all()代码进行删除后,这些代码又会按照原来的执行方式进行执行了,这是因为这个monkey方法对这些产生阻塞的方法进行了偷梁换柱,已经将这些阻塞的方法换成了自己的代码,所以要将这段代码放在最上方,先导入其中的方法

4、猴子补丁

猴子补丁的原理是重新写带有阻塞的类中的方法,我们在使用猴子补丁时实际上已经把这些方法进行了覆盖

import json
​
import gevent
from gevent import monkey
monkey.patch_all()
​
def func(args):
    print("这是一个假的方法")
​
def func1(args):
    print("这是一个假的方法")
​
def my_patch():
    json.load = func
    json.loads = func1
​
​
my_patch()
​
json.loads("aaa")
json.load("aaa")
​
# 这是一个假的方法
# 这是一个假的方法

使用猴子补丁可以利用名称空间的查找规格将系统的方法屏蔽,将我们定义的方法覆盖覆盖原方法,然后再进行调用

 

原文地址:https://www.cnblogs.com/lice-blog/p/10986926.html