进程理论要点

一、进程理论

1、程序和进程

程序:一堆代码 
进程:正在运行的程序 
进程是一个抽象的概念,每一个进程都有它自己独立的内存空间

2、同步和异步:针对任务的提交方式

同步:提交任务之后,原地等待任务的返回结果,期间不做任何事(叫人吃饭,一直等待) 
异步:提交任务之后,不等待任务的返回结果,执行运行下一行代码(叫人吃饭,但自己先走) 

3、阻塞与非阻塞:针对程序运行的状态

阻塞:遇到io操作 ->>阻塞态 
非阻塞:就绪或者运行态

二、创建进程的两种方式

1、方式一

from multiprocessing import Process
import time

def task(name):
    print('%s is running' % name)
    time.sleep(3)
    print('%s is over' % name)


# 注意,在windows系统中,创建进程会将代码以模块的方式从头到尾加载一遍
# 一定要写在if __name__ == '__main__':代码块里面
# 强调:函数名一旦加括号,执行优先级最高,立刻执行
if __name__ == '__main__':
    p1 = Process(target=task, args=('egon',))   # # 这一句话只是实例化了一个Process对象
    p1.start()     # 告诉操作系统创建一个进程,操作系统会申请内存空间,然后把父进程的数据拷贝给子进程,作为子进程的初始状态
    print('主进程')

2、方式二

from multiprocessing import Process
import time

class MyProcess(Process):
    def __init__(self, name):
        super().__init__()
        self.name = name

    def run(self):
        print('%s is running' % self.name)
        time.sleep(1)
        print('%s is end' % self.name)

if __name__ == '__main__':
    obj = MyProcess('egon')
    obj.start()
    print('主进程')

三、join方法:join主进程等待子进程结束才继续运行

from multiprocessing import Process
import time

def task(name, n):
    print('%s is running' % name)
    time.sleep(n)if __name__ == '__main__':
    start_time = time.time()
    p_list = []
    for i in range(3):
        p = Process(target=task, args=('子进程%s' % i, i))
        p.start()
        p_list.append(p)
    for i in p_list:
        i.join()
    print('主进程', time.time()-start_time)

# 结果为
子进程0 is running
子进程1 is running
子进程2 is running
主进程 2.624150037765503

四、进程对象其他方法

from multiprocessing import Process, current_process
import time
import os

def task():
    print('%s is running' % os.getpid())
    time.sleep(3)
    print('%s is over' % os.getppid())

if __name__ == '__main__':
    p1 = Process(target=task)
    p1.start()
    p1.terminate()  # 杀死子进程
    time.sleep(0.1)
    print(p1.is_alive())  # 判断子进程是否存活
    print('')

五、进程之间内存隔离

# 记住进程与进程之间数据是隔离的!!!
from multiprocessing import Process

x = 100
def task():
    global x
    x = 20
    print('子进程', x)


if __name__ == '__main__':
    p = Process(target=task)
    p.start()
    p.join()
    print('主进程', x)

# 结果为
子进程 20
主进程 100

六、守护进程

主进程一旦运行完毕,子进程立即结束运行

应用场景:开子进程的目的是并发的执行任务,当这个任务是伴随着主进程整个生命周期结束之后,这个任务也就没有存在的意义了,就应该把子进程做成守护进程

from multiprocessing import Process
import time

def task(name):
    print('%s正活着' % name)
    time.sleep(3)
if __name__ == '__main__':
    p = Process(target=task, args=('egon总管',))
    p.daemon = True
    p.start()
    print('主进程正在结束')  
解果为
主进程正在结束

七、互斥锁

①锁千万不要随意去用
②牺牲了效率但是保证了数据的安全
③锁一定要在主进程中创建,给子进程去用
④解决多个进程操作同一份数据造成数据不安全的情况
⑤加锁会将并发变成串行
⑥锁通常用在对数据操作的部分,并不是对进程全程加锁
mutex.acquire()  # 抢锁   一把锁不能同时被多个人使用,没有抢到的人,就一直等待锁释放
buy(i)
mutex.release()  # 释放锁
from multiprocessing import Process, Lock
import json
import time
import random

def search(i):
    with open('info', 'r', encoding='utf-8') as f:
        data = json.load(f)
    print('用户查询余票数%s' % data.get('ticket'))

def buy(i):
    # 买票之前还得先查有没有票!
    with open('info', 'r', encoding='utf-8') as f:
        data = json.load(f)
    time.sleep(random.randint(1, 3)) # 模拟网络延迟
    if data.get('ticket') > 0:
        data['ticket'] -= 1       # 买票

        with open('info', 'w', encoding='utf-8') as f:
            json.dump(data, f)
        print('用户%s抢票成功' % i)
    else:
        print('用户%s查询余票为0' % i)

def run(i, mutex):
    search(i)
    mutex.acquire()    # 抢锁   一把锁不能同时被多个人使用,没有抢到的人,就一直等待锁释放
    buy(i)
    mutex.release()    # 释放锁

if __name__ == '__main__':
    mutex = Lock()       # 创建锁
    for i in range(5):
        p = Process(target=run, args=(i, mutex))
        p.start()

# 结果为
用户查询余票数3
用户查询余票数3
用户查询余票数3
用户查询余票数3
用户查询余票数3
用户1抢票成功
用户0抢票成功
用户2抢票成功
用户3查询余票为0
用户4查询余票为0

八、进程间通信 IPC(InterProcess Communication)

1、队列:先进先出,堆栈:先进后出

注意:队列用来储存进程之间沟通的消息,数据量不应该过大

maxsize的值超过内存限制就变的毫无意义。q = Queue(maxsze)

from multiprocessing import Queue
q = Queue(5)   # 产生一个最多能够存放五个数据的队列
q.put(1)
q.put(2)
q.put(3)
print(q.full())  # False
q.put(4)
q.put(5)         # 只能放进去五个
print(q.full())  # True  # 判断队列是否放满
q.put(6)         # 再放一个放不进去了,程序不会报错会阻塞


# 存储数据
for i in range(5):
    q.put(i)            # for循环往队列里面存放数据
print(q.get())    # 0   # 取数据,get一次就取一个
print(q.get())    # 1
print(q.get())    # 2
print(q.empty())  # False
print(q.get())    # 3
print(q.get())    # 4
print(q.empty())  # True  # 判断队列数据是否为空,需要注意的是,在并发的情况下,这个方法判断不准确!
print(q.get())    # 取完了,队列为空,get会在原地等待队列中有数据过来

2、基于队列实现进程间通信

from multiprocessing import Queue, Process

def producer(q):
    q.put('你好')

def consumer(q):
    print(q.get())

if __name__ == '__main__':
    q = Queue()  # 生成一个队列对象
    p1 = Process(target=producer, args=(q,))
    c1 = Process(target=consumer, args=(q,))
    p1.start()
    c1.start()
# 结果为 你好

九、生产者消费者模型(*****)

1、生产者:生产数据的任务
  消费者:处理数据的任务
2、两者之间的通信介质:队列 / 管道
3、为什么有: 解决供需不平衡的问题 
4、怎么解决: 定义一个队列,用来存放固定数量的数据 
           生产者生产的数据放到队列里面,消费者去队列里面获取数据
5、实现生产者消费者模型三要素        
  生产者 
  消费者
   队列 
6、什么时候用该模型: 
   程序中出现明显的两类任务,一类任务是负责生产数据,另外一类任务是负责处理生产的数据的 
7、该模型的好处: 
    ①实现了生产者与消费者解耦和 
    ②平衡了生产力与消费力,即生产者可以一直不停地生产,消费者可以不停地处理,因为二者不再直接沟通的,而是跟队列沟通
from multiprocessing import Process, JoinableQueue
import time

def producer(name, food, q):
    for i in range(5):
        data = '%s生产了%s %s' % (name, food, i)
        time.sleep(2)
        print(data)
        q.put(data)        # 将生产的数据放入队列中

def consumer(name, q):
    while True:
        data = q.get()
        if data is None: break
        time.sleep(2)
        print('%s吃了%s' %(name, data))
        q.task_done()      # 告诉你的队列,你已经将数据取出并且处理完毕

if __name__ == '__main__':
  
# JoinableQueue: 可join的队列,该队列相比普通的Queue的区别在于该队列额外增加了join函数 q = JoinableQueue() # 生成一个队列对象 p1 = Process(target=producer, args=('egon', '包子', q)) p2 = Process(target=producer, args=('tank', '油条', q)) c1 = Process(target=consumer, args=('jerry', q)) c2 = Process(target=consumer, args=('tom', q)) p1.start() p2.start() c1.daemon = True # c.daemon = True: 主进程运行完不会检查子进程的状态(是否执行完),直接结束进程; c2.daemon = True # 子进程跟随主进程结束而结束 c1.start() c2.start() # 等待生产者生产完所有的数据 p1.join() p2.join() # 在生产者生产完数据之后,往队列里面放一个提示性的消息,告诉消费者已经没有数据,你走吧,不要等了 q.join() # q.join()等待所有数据全部处理完毕 print('')
原文地址:https://www.cnblogs.com/zhangguosheng1121/p/10822825.html