Python基础-多线程与多进程


一,线程与进程之间的关系:(从知乎上看到的)

一个必须知道的事实:执行一段程序代码,实现一个功能的过程介绍 ,当得到CPU的时候,相关的资源必须也已经就位,就是显卡啊,GPS啊什么的必须就位,然后CPU开始执行。这里除了CPU以外所有的就构成了这个程序的执行环境,也就是我们所定义的程序上下文。当这个程序执行完了,或者分配给他的CPU执行时间用完了,那它就要被切换出去,等待下一次CPU的临幸。在被切换出去的最后一步工作就是保存程序上下文,因为这个是下次他被CPU临幸的运行环境,必须保存。

串联起来的事实:前面讲过在CPU看来所有的任务都是一个一个的轮流执行的,具体的轮流方法就是:先加载程序A的上下文,然后开始执行A,保存程序A的上下文,调入下一个要执行的程序B的程序上下文,然后开始执行B,保存程序B的上下文。。。

========= 重要的东西出现了========
进程和线程就是这样的背景出来的,两个名词不过是对应的CPU时间段的描述,名词就是这样的功能。
  • 进程就是包换上下文切换的程序执行时间总和 = CPU加载上下文+CPU执行+CPU保存上下文

线程是什么呢?
进程的颗粒度太大,每次都要有上下的调入,保存,调出。如果我们把进程比喻为一个运行在电脑上的软件,那么一个软件的执行不可能是一条逻辑执行的,必定有多个分支和多个程序段,就好比要实现程序A,实际分成 a,b,c等多个块组合而成。那么这里具体的执行就可能变成:

程序A得到CPU =》CPU加载上下文,开始执行程序A的a小段,然后执行A的b小段,然后再执行A的c小段,最后CPU保存A的上下文。

这里a,b,c的执行是共享了A的上下文,CPU在执行的时候没有进行上下文切换的。这里的a,b,c就是线程,也就是说线程是共享了进程的上下文环境,的更为细小的CPU时间段。

到此全文结束,再一个总结:

进程和线程都是一个时间段的描述,是CPU工作时间段的描述,不过是颗粒大小不同,一个进程中包含了多个线程,在一个时间段内,只能有一个线程占用cpu,cpu不能同时执行多个任务,只不过cpu运行速度太快,我们感知不到,就以为,线程可以同时执行,对于多核cpu,实际也同一个时间段也只有一个cpu在工作
 
二,多线程,使用threading模块
一个简单的多线程
 
import threading

import time

def axb(name):
    time.sleep(1)
    print(name)
for i in range(10):
    t=threading.Thread(target=axb,args=(i,))  ##args 定义的是一个元组,必须加逗号,才能识别为元组
    t.start()

print('game over')

三,线程等待

 线程等待,多线程在运行的时候,每个线程都是独立运行的,不受其他的线程干扰,如果想在哪个线程运行完之后,再做其他操作的话,就得等待它完成,那怎么等待呢,使用join,等待线程结束


import threading
import time
def run():
print('qqq')
time.sleep(1)
print('done!')
lis = []
for i in range(5):
t = threading.Thread(target=run)
lis.append(t)
t.start()
for t in lis:
t.join() #主线程等待子线程执行完
print('over')
 

四,获取多线程时执行结果的返回值

例如我们做接口测试时候,需要获取每个线程执行时间

import threading
import time
import requests
run_times = []
#怎么获取到多线程执行的函数里面的返回值
def blog():
    stat_time = time.time()
    r = requests.get('http://www.nnzhp.cn/').text
    end_time = time.time()
    run_time = end_time-stat_time
    run_times.append(run_time)
objs = []
for i in range(100):
    t = threading.Thread(target=blog())
    t.start()
    objs.append(t)
for obj in objs:
    obj.join()#join中可以设置timeout时间,主线程等待时间超过timeout时间后就会继续执行,不再等待
avg = sum(run_times)/len(run_times)
print('平均响应时间是',avg)

五,守护线程:就相当于你是一个国王(非守护线程),然后你有很多仆人(守护线程),这些仆人都是为你服务的,一但你死了,那么你的仆人都给你陪葬。

主线程死掉了(执行完了),那么不管子线程运行完否,都一起结束
import time
import threading

def  test():
    time.sleep(2)
    print('hhhh')
for i in range(5):
    t=threading.Thread(target=test)
    t.setDaemon(True)#设置子线程为守护线程
    t.start()

程序执行结果不会打印 hhhh,因为主线程执行完的时候,子线程还没执行完,所以,主线程死掉了,守护子线程跟着消亡了

六、锁:线程锁就是,很多线程一起在操作一个数据的时候,可能会有问题,就要把这个数据加个锁,同一时间只能有一个线程操作这个数据。

import threading
from threading import Lock

num = 0
lock = Lock()  # 申请一把锁

def run():
    global num
    lock.acquire()  # 加锁
    num += 1
    lock.release()  # 解锁

lis = []
for i in range(5):
    t = threading.Thread(target=run)
    t.start()
    lis.append(t)
for t in lis:
    t.join()
print('over', num)

七,多进程:Python里面的多线程,是不能利用多核CPU的,如果想利用多核CPU的话,就得使用多进程,python中多进程使用multiprocessing模块。

from  multiprocessing  import Process
import time

def test(i):
    time.sleep(1)
    print(i)

if __name__=='__main__':
    for i in range(10):
        p=Process(target=test,args=(i,))
        p.start()

threading与实例对象提供了几个方法可以让我们更直观的学习线程。

threading.active_count()  # 返回当前运行的线程个数
 
threading.enumerate()  # 返回当前运行中的线程list
 
threading.current_thread()  # 返回当前的线程变量
 
t1.start()  # 启动线程
 
t1.is_alive()  # 判断线程是否在运行 运行指启动后、终止前。
 
t1.getName()  # 获取线程名
 
t1.setName('填写更改后的名称')  # 对线程进行命名
 
t1.setDaemon(True)  # 设置守护线程
 
t1.isDaemon()  # 判断是否是守护线程
 
t1.join(timeout=20)  # 阻塞当前上下文环境的线程,直到调用此方法的线程终止或到达指定的timeout(可选参数)
原文地址:https://www.cnblogs.com/niuniu2018/p/8006172.html