python之并发编程

一、操作系统与应用程序

　　在没有介绍线程与进程相关的知识之前，需要给大家引入一个知识点，关于操作系统与应用程序又与线程与进程有什么关系？

　　硬件
    ...
　　装系统
    　　系统就是一个有程序员写出来的软件,该软件用于控制计算机硬件,让他们之间相互配合
　　装软件(安装应用程序)
    　　...
　　并发与并行
    　　并发,假,由于执行速度贴别快,感觉不到停顿
    　　并行,真,创建10个人同时操作
　　线程与进程
    　　单线程与单进程
        　　一个软件默认一个进程,可以有多个
    　　线程:
        　　工作的最小单元
        　　共享进程中的所有资源
        　　每个线程可以分担一些任务，最终完成最后的结果
    　　进程:
        　　独立开辟内存
        　　进程之间的数据隔离
    　　注:GIL锁,是在进程中起到了阻塞线程的作用
　　总结:
    　　1.操作系统帮助开发者操作硬件
    　　2.程序员写好代码在操作系统上运行(依赖解释器)
    　　3.任务特别多
       　　 python多线程情况下:
            　　计算密集型操作:效率低
            　　IO操作:效率高
        　　python多进程情况下:
            　　计算密集型操作:效率高(浪费资源)
            　　IO操作:效率高(浪费资源)
        　　以后写python时:
            　　IO密集型用多线程
           　　计算密集型用多进程
        　　java多线程情况下:
            　　计算密集型操作:效率高
            　　IO操作:效率高
        　　java多进程情况下:
            　　计算密集型操作:效率高(浪费资源)
            　　IO操作:效率高(浪费资源)

    GIL锁:全局解释器锁,用于限制一个进程中间同一个时刻只有一个线程被cpu调度
    扩展:默认GIL锁在执行100个指令

二、线程/进程/协程
　　线程是程序中一个单一的顺序控制流程。进程内有一个相对独立的、可调度的执行单元，是系统独立调度和分派CPU的基本单位
　指令运行时的程序的调度单位。在单个程序中同时运行多个线程完成不同的工作，称为多进程。
　　
　　线程的简单示例:

 1 import time
 2     import threading
 3     def task():
 4         time.sleep(0)   #0秒也会有延迟
 5         print("拿快递")
 6     # 创建一个线程
 7     t = threading.Thread(target=task)
 8     # 执行线程
 9     t.start()
10 
11     print("干什么。。。")
12 
13     import time
14     import threading
15 
16     def task(n):
17         print("执行任务",n)
18         time.sleep(5)
19         print("...")
20         print("任务%s 执行完毕" %n)
21     while True:
22         name = input("请输入任务")
23         t = threading.Thread(target=task,args=(name,))
24         t.start()

所以说线程就像是流水线一样，走到哪里该作什么，是早已经规划好的。

　　线程的使用:

1 import threading,time
2 def num():
3     print("456")
4 t = threading.Thread(target=num)
5 t.start()
6 print("123")
7 # 运行结果
8 456
9 123

　　setDaemon方法

 1 import threading,time
 2 def sleep(arg):
 3     time.sleep(arg)
 4     print(arg)
 5 
 6 t1 = threading.Thread(target=sleep,args=(3,))
 7 t1.start()
 8 
 9 t2 = threading.Thread(target=sleep,args=(6,))
10 t2.setDaemon(True)
11 t2.start()
12 
13 print("1")
14 # 运行结果
15 # 1
16 # 3
17 # 总结，线程中的主线程默认会等其他线程执行完毕后才关闭
18 # 当设置setDaemon(True)的时候会不等

　　join方法

 1 import threading,time
 2 
 3 def join(arg):
 4     time.sleep(arg)
 5     print(arg)
 6 print("123")
 7 t1 = threading.Thread(target=join,args=(3,))
 8 t1.start()
 9 t1.join()
10 print("456")
11 #  运行结果:
12 # 123
13 # 3
14 # 456
15 # 总结:当在子线程中添加join方法(可以加参数，表示最多等多久)，则会等待子线程运行完毕后执行主线程

　　获取线程的名称相关

 1 import threading
 2 def name():
 3     t = threading.current_thread() # 获取当前线程的对象
 4     print(t.name)
 5 
 6 t1 = threading.Thread(target=name)
 7 t1.setName("amazing")
 8 t1.start()
 9 
10 t2 = threading.Thread(target=name)
11 t2.setName("Magic")
12 t2.start()
13 # 运行结果
14 # amazing
15 # Magic
16 # 总结:可以在函数中添加threading.current_thread()用来获取当前线程的对象

　　线程池

 1 from concurrent.futures import ThreadPoolExecutor
 2 import time
 3 
 4 pool = ThreadPoolExecutor(5)        #创建一个线程池，并设置同时最多有5个线程可以被调度
 5 def func(arg):
 6     time.sleep(1)
 7     print(arg)
 8 for i in range(4):
 9     pool.submit(func,i)      # 去线程池中申请一个线程执行func函数
10 # 有节制的约束线程的创建，保证线程的性能。

　　进程是计算机是系统进行资源分配和调度的基本单位，进程是线程的容器。程序是指令、数据及其组织形式的描述，进程是程序的实体。

　　进程的编写

 1 import multiprocessing
 2 
 3 def task(arg):
 4     print(arg)
 5 def run():
 6     for i in range(10):
 7         p = multiprocessing.Process(target=task,args=(i,))
 8         p.start()
 9 if __name__ == '__main__':    # 在windows系统中 需要将主进程放在main方法下运行
10     run()

　　进程的使用

　　join

 1 import multiprocessing,time
 2 def task(arg):
 3     time.sleep(2)
 4     print(arg)
 5 def run():
 6     for i in range(10):
 7         p = multiprocessing.Process(target=task,args=(i,))
 8         p.start()
 9         p.join(1)
10         print("等待结束")
11 if __name__ == '__main__':
12     run()
13 # 总结:join等待进程完成过后才执行

　　daemon

 1 import multiprocessing,time
 2 def task(arg):
 3     time.sleep(2)
 4     print(arg)
 5 def run():
 6     print("123")
 7     p = multiprocessing.Process(target=task,args=(789,))
 8     p.daemon = True
 9     p.start()
10 
11     print("456")
12 if __name__ == '__main__':
13     run()
14 总结:当daemon=True表示不等待

　　name

 1 import multiprocessing,time
 2 def task(arg):
 3     p = multiprocessing.current_process()
 4     print(p.pid)  #p.ident
 5     time.sleep(2)
 6     print(arg)
 7 def run():
 8     for i in range(10):
 9         p = multiprocessing.Process(target=task,args=(i,))
10         p.name = "asd"
11         p.start()
12         p.join(1)
13         print("等待结束")
14 if __name__ == '__main__':
15     run()

　　进程间的相关问题

　　　　进程间的数据是否相互共享?

 1 import multiprocessing
 2 data_list =[]
 3 def task(arg):
 4     data_list.append(arg)
 5     print(data_list)
 6 def run():
 7     for i in range(10):
 8         p = multiprocessing.Process(target=task,args=(i,))
 9         p.start()
10 if __name__ == '__main__':
11     run()
12 进程中的数据是不共享的

　　　　怎么做才能够数据间的相互共享

　　　　　　Queue()

 1 import multiprocessing,queue,time
 2 
 3 q = multiprocessing.Queue()
 4 def task(arg):
 5     q.put(arg)
 6 
 7 def run():
 8     for i in range(10):
 9         p = multiprocessing.Process(target=task,args=(i,))
10         p.start()
11     time.sleep(2)
12     v1 = q.get()
13     print(v1)
14 if __name__ == '__main__':
15     run()

　　　　　　Manager()

 1 import multiprocessing,queue,time
 2 m = multiprocessing.Manager()
 3 dic = m.dict()
 4 
 5 def task(arg):
 6     dic[arg] = 100
 7 
 8 def run():
 9     for i in range(10):
10         p = multiprocessing.Process(target=task,args=(i,))
11         p.start()
12         p.join()
13     input(">>>")
14     print(dic.valus)
15 if __name__ == '__main__':
16     run()

　　进程池

 1 from concurrent.futures import ProcessPoolExecutor
 2 import time
 3 
 4 def task(arg):
 5     time.sleep(2)
 6     print(arg)
 7 
 8 if __name__ == '__main__':
 9     pool  = ProcessPoolExecutor(5)
10     for i in range(10):
11         pool.submit(task,i)

　　协程不是真实存在的东西,是程序员创造出来的，协程指的是微线程。

　　协程的编写

 1 import greenlet
 2 def func1():
 3     print("123")
 4     gr2.switch()
 5     print("987")
 6     gr2.switch()
 7 def func2():
 8     print("465")
 9     gr1.switch()
10     print("789")
11 # 协程1
12 gr1 = greenlet.greenlet(func1)
13 # 协程2
14 gr2 = greenlet.greenlet(func2)
15 
16 # 执行协程1
17 gr1.switch()

 1 基于yield实现协程
 2 def f1():
 3     print(11)
 4     yield
 5     print(22)
 6     yield
 7     print(33)
 8 
 9 def f2():
10     print(44)
11     yield
12     print(55)
13     yield
14     print(66)
15 v1 = f1()
16 v2 = f2()
17 next(v1)

　　协程的作用

　　对一个线程进程分片，使得线程在代码块之间进行来回切换执行，而不是按原来的流程执行。
　　...

三、锁相关

　　"锁"顾名思义，就是用来约束某种对象。

　　锁的简单示例

 1 import threading,time
 2 lock = threading.RLock()  # 创建锁都对象
 3 n = 10
 4 def lk(i):
 5     print("代码不加锁",i)
 6     lock.acquire()  #加锁
 7     global n
 8     print("当前线程",i,"读取到的n值为:",n)
 9     n = i
10     time.sleep(1)
11     print("当前线程",i,"读取到的n值为:",n)
12     lock.release()  #释放锁头
13 for i in range(10):
14     t = threading.Thread(target=lk,args=(i,))
15     t.start()
16 # 总结:加完锁之后此区域的代码同一时刻只能有一个线程执行

线程安全与线程不安全的问题
    当多线程操作时，内不会让所有线程排队处理这时候线程是安全的，例如:list/dict/Queue
    线程不安全 + 人(锁) => 排队处理

锁的用法:
　　lock 普通锁　最简单的锁

 1 import threading,time
 2 v = []
 3 lock = threading.Lock()    # 创建一个lock对象
 4 def func(arg):
 5     lock.acquire()      # 添加锁
 6     v.append(arg)
 7     time.sleep(1)
 8     m = v[-1]
 9     print(arg,m)
10     lock.release()          # 释放锁
11 for i in range(10):
12     t = threading.Thread(target=func,args=(i,))
13     t.start()
14 # 总结:在普通锁中当多个lock存在时会死锁

　　Rlock 递归锁 也是最常用的锁

import threading,time
lock = threading.RLock()
v = []
def func(arg):
    lock.acquire()
    lock.acquire()      # 添加多个锁
    v.append(arg)
    time.sleep(1)
    m = v[-1]
    print(arg,m)
    lock.release()
    lock.release()
for i in range(10):
    t = threading.Thread(target=func,args=(i,))
    t.start()

# 总结:支持递归的锁多次解多次，允许多个lock同时存

　　BoundedSemapore 信号锁

 1 import threading,time
 2 lock = threading.BoundedSemaphore(5)     # 表示通过设定可以放行n个线程
 3 
 4 def func(arg):
 5     lock.acquire()
 6     print(arg)
 7     time.sleep(1)
 8     lock.release()
 9 for i in range(20):
10     t = threading.Thread(target=func,args=(i,))
11     t.start()
12 
13 # 总结:可以一次放行多个线程。

　　Condition 条件锁

 1 import threading,time
 2 lock = threading.Condition()
 3 def func(arg):
 4     lock.acquire()
 5     lock.wait()     # 表示等待,线程到此处停止需要一个接收值通知放行多少个线程
 6     print(arg)
 7     time.sleep(1)
 8     lock.release()
 9 for i in range(20):
10     t = threading.Thread(target=func,args=(i,))
11     t.start()
12 
13 while True:
14     user_input = int(input("请输入要放行的个数"))
15     lock.acquire()
16     lock.notify(user_input)
17     lock.release()
18 总结: 在使用该方法时需要在主线程或其他线程中，写通知wait的方法，告诉wait放行多少个线程

　　Event 事件锁

 1 import time,threading
 2 lock = threading.Event()
 3 def func(arg):
 4     lock.wait()    # 表示当线程到此处停住，相当于红灯
 5     print(arg)
 6 for i in range(10):
 7     t = threading.Thread(target=func,args=(i,))
 8     t.start()
 9 user_input = input("输入红灯或绿灯")
10 if user_input =="绿灯":
11     lock.set()    # 表示一次性释放所有线程 ，相当于绿灯
12 else:
13     pass
14 
15 # 总结: 一次性放行所有

　　进程锁的使用方法大体与线程数相同，只是在导入模块时是import multiprocessing，调用的时候也是。

为甚么要用锁?
    1.线程安全,列表和字典线程安全:
        非线程安全
        控制一段代码
　　2.如果多个线程同时修改一个值的时候需要加锁

线程锁/进程锁/GIL锁
　　线程锁是为了在线程进行数据操作时保证数据的安全性(涉及到线程安全问题)
　　进程锁是为了在数据共享时起到防护的作用
　　GIL锁是为了限制同一个进程中只能有一个线程进入python解释器

threading.local()  *

 1 import threading,time
 2 v = threading.local()
 3 
 4 def func(arg):
 5     v.space = arg   # 在函数内部会创建一个属于自己的空间
 6     time.sleep(1)
 7     print(v.space,arg)
 8 
 9 for i in range(10):
10     t = threading.Thread(target=func,args=(i,))
11     t.start()
12 
13 # 总结:为不同的线程创建一个空间(字典)，可以去当前自己空间里面存取值

生产者消费者模型
    生产者
    　　队列:先进先出
    　　栈:先进后出
    消费者
        更便利

　　简单示例:

 1 import queue,threading,time
 2 
 3 q = queue.Queue()
 4 
 5 def producer(id):
 6     """
 7     表示生产者
 8     :param id:
 9     :return:
10     """
11     while True:
12         time.sleep(1)
13         q.put("发送信息")
14         print("%s号用户发送信息"%id)
15 
16 for i in range(1,5):
17     t =threading.Thread(target=producer,args=(i,))
18     t.start()
19 
20 def consumer(id):
21     """
22     表示消费者
23     :param id:
24     :return:
25     """
26     while True:
27         time.sleep(1)
28         q.get("获得信息")
29         print("%s号客服获得信息"%id)
30 
31 for i in range(1,5):
32     t =threading.Thread(target=consumer,args=(i,))
33     t.start()
34 
35 # 总结:生产者消费者模型解决了不用一直等待的问题





。。。