python------并发编程

一 操作系统的作用:

  1:隐藏丑陋复杂的硬件接口,提供良好的抽象接口

  2:管理、调度进程,并且将多个进程对硬件的竞争变得有序

二 多道技术:

  1.产生背景:针对单核,实现并发

  ps:

  现在的主机一般是多核,那么每个核都会利用多道技术

  有4个cpu,运行于cpu1的某个程序遇到io阻塞,会等到io结束再重新调度,会被调度到4个

  cpu中的任意一个,具体由操作系统调度算法决定。

  2.空间上的复用:如内存中同时有多道程序

  3.时间上的复用:复用一个cpu的时间片

  强调:遇到io切,占用cpu时间过长也切,核心在于切之前将进程的状态保存下来,这样 才能保证下次切换回来时,能基于上次切走的位置继续运行

三、进程

  进程:正在进行的一个过程或者说一个任务。而负责执行任务的则是cpu

  程序:仅仅只是一堆代码而已,而进程指的是程序的运行过程。

  需要强调的是:同一个程序执行两次,那也是两个进程,比如打开暴风影音,虽然都是同一个软件,但是一个可以播放大话西游,一个可以播放海贼王。

关于multiprocess模块——综合的、多元的 进程模块(包):python中创建进程用来替我做事。

import os
from multiprocessing import Process  #导入进程模块
import time
def func():
    time.sleep(2)
    print('子进程号%d'%os.getpid())


if __name__ =='__main__':
    p=Process(target=func)
    p.start()                                  #启动子进程
    print('第一次主进程号%d'%os.getpid())
    p.join()                                              #阻塞
    print('第二次主进程号%d'%os.getpid())

有两种情况:

  1、没有p.join()  :这种情况下不阻塞,执行主程序,调用子进程。子进程和父进程是异步执行。

创建进程对象 传要执行的函数 以及参数
进程对象.start()
主进程和子进程就是异步执行
如果主进程中的代码已经结束了,子进程还没结束,主进程会等待子进程

p.join 就是主进程会阻塞在join的位置,等待p进程结束
windows操作系统中 创建进程的语句一定要放在if __name__ == '__main__':条件语句下面

  2、有p.join():主进程阻塞在join的位置,等待p进程的结束(异步阻塞)

2、开启多个子进程 

import os
import time
from multiprocessing import Process
def func(i):
    time.sleep(3)
    print('%d :子进程%d干的事,父进程%d干的事'%(i,os.getpid(),os.getppid()))

if __name__=='__main__':
    p_lst=[]
    for i in range(10):
        p=Process(target=func,args=(i,))     #实例化,调用线程类,传参数
        p.start()                            #启动线程(类似传达一下消息
        p_lst.append(p) 
    for p in p_lst:
        p.join()                              #阻塞
    print('-------主进程-------')

  创建一个线程,然后启动(对象名.start),它会在未知的时间里创建线程,所以至于它是不是在主线程之前还是之后启动都不能确定。如果想要主线程在所有线程后等待,那么需要预先创建一个空列表,然后把所有启动的子线程放入列表中,对列表中的子线程总体进行循环阻塞后,启动主线程。

3、另一种开启多进程的方法

import os
from multiprocessing import Process
class MyProcess(Process):  #必须创建一个类,必须继承Process方法
    def run(self):               #必须实现run方法
        print('子进程%d'%os.getpid())
        self.walk()
    def walk(self):
        print('子进程walk%d'%os.getpid())

if __name__ =='__main__':
    p=MyProcess()            #先实例化一个对象
    p.start()                   #启动子进程
    p.join()
    print('主进程%d'%os.getpid())  #主进程

4.守护进程

  守护进程:守护进程会随着主进程的代码的结束而结束

  守护进程的作用:会随着主进程的代码执行结束而结束,不会等待其他子进程

  守护进程要在start之前设置,在守护进程(也是个子进程)中,不能再开启子进程。

import time
from multiprocessing import Process
def func():
    print('--'*10)
    time.sleep(15)
    print('--'*10)

def cal_time():
    while True:
        time.sleep(1)
        print('过去了1秒')

if __name__ == '__main__':
    p = Process(target=cal_time)
    p.daemon = True     # 一定在开启进程之前设置
    p.start()
    p2 = Process(target=func)  # 15s
    p2.start()
    for i in range(100):    # 10s
        time.sleep(0.1)
        print('*'*i)
    p2.join()
View Code

锁Lock:

  在并发编程中,为了保证数据安全。加上锁之后,每次需要等待数据被访问完之后,才能继续被其他应用访问。

import json
import time
import random
from multiprocessing import Lock
from multiprocessing import Process

def search(i):
    with open('ticket') as f:
        print(i,json.load(f)['count'])

def get(i):
    with open('ticket') as f:
        ticket_num = json.load(f)['count']
    time.sleep(random.random())
    if ticket_num > 0:
        with open('ticket','w') as f:
            json.dump({'count':ticket_num-1},f)
        print('%s买到票了'%i)
    else:
        print('%s没票了'%i)

def task(i,lock):
    search(i)   # 查看票
    lock.acquire()                  #需要锁
    get(i)      # 抢票
    lock.release()               #释放锁

if __name__ == '__main__':
    lock = Lock()            #实例化锁
    for i in range(20):  # 20个人同时抢票
        p = Process(target=task,args=(i,lock))
        p.start()
锁Lock

信号量:一把钥匙多个锁,可以允许几个进程同时访问数据(数量是有限制的)

from multiprocessing import Semaphore
from multiprocessing import Process
import time
import random
def sing(i,sem):
    sem.acquire()
    print('%d进入KTV'%i)
    time.sleep(random.randint(1,10))
    print('%d离开ktv'%i)
    sem.release()

if __name__ =='__main__':
    sem=Semaphore(4)
    for i in range(20):
        Process(target=sing,args=(i,sem)).start()

四、并发与并行

  无论是并行还是并发,在用户看来都是'同时'运行的,不管是进程还是线程,都只是一个任务而已,真是干活的是cpu,cpu来做这些任务,而一个cpu同一时刻只能执行一个任务

    1 并发:是伪并行,即看起来是同时运行。单个cpu+多道技术就可以实现并发,(并行也属于并发)

       2  并行:同时运行,只有具备多个cpu才能实现并行

    单核下,可以利用多道技术,多个核,每个核也都可以利用多道技术(多道技术是针对单核而言的

      有四个核,六个任务,这样同一时间有四个任务被执行,假设分别被分配给了cpu1,cpu2,cpu3,cpu4,

      一旦任务1遇到I/O就被迫中断执行,此时任务5就拿到cpu1的时间片去执行,这就是单核下的多道技术

       而一旦任务1的I/O结束了,操作系统会重新调用它(需知进程的调度、分配给哪个cpu运行,由操作系统说了算),可能被分配给四个cpu中的任意一个去执行

所有现代计算机经常会在同一时间做很多件事,一个用户的PC(无论是单cpu还是多cpu),都可以同时运行多个任务(一个任务可以理解为一个进程)。

  启动一个进程来杀毒(360软件)

  启动一个进程来看电影(暴风影音)

  启动一个进程来聊天(腾讯QQ)

  所有的这些进程都需被管理,于是一个支持多进程的多道程序系统是至关重要的

  多道技术概念回顾:内存中同时存入多道(多个)程序,cpu从一个进程快速切换到另外一个,使每个进程各自运行几十或几百毫秒,这样,虽然在某一个瞬间,一个cpu只能执行一个任务,但在1秒内,cpu却可以运行多个进程,这就给人产生了并行的错觉,即伪并发,以此来区分多处理器操作系统的真正硬件并行(多个cpu共享同一个物理内存)

五、同步/异步和阻塞/非阻塞

  同步:就是在发出一个功能调用时,在没有得到结果之前,该调用就不会返回。按照这个定义,其实绝大多数函数都是同步调用。但是一般而言,我们在说同步、异步的时候,特指那些需要其他部件协作或者需要一定时间完成的任务。

  异步:当一个异步功能调用发出后,调用者不能立刻得到结果。当该异步功能完成后,通过状态、通知或回调来通知调用者。如果异步功能用状态来通知,那么调用者就需要每隔一定时间检查一次,效率就很低(有些初学多线程编程的人,总喜欢用一个循环去检查某个变量的值,这其实是一 种很严重的错误)。如果是使用通知的方式,效率则很高,因为异步功能几乎不需要做额外的操作。至于回调函数,其实和通知没太多区别。

  阻塞:是指调用结果返回之前,当前线程会被挂起(如遇到io操作)。函数只有在得到结果之后才会将阻塞的线程激活。有人也许会把阻塞调用和同步调用等同起来,实际上他是不同的。对于同步调用来说,很多时候当前线程还是激活的,只是从逻辑上当前函数没有返回而已。

  非阻塞:指在不能立刻得到结果之前也会立刻返回,同时该函数不会阻塞当前线程。

小结:

  1. 同步与异步针对的是函数/任务的调用方式:同步就是当一个进程发起一个函数(任务)调用的时候,一直等到函数(任务)完成,而进程继续处于激活状态。而异步情况下是当一个进程发起一个函数(任务)调用的时候,不会等函数返回,而是继续往下执行当,函数返回的时候通过状态、通知、事件等方式通知进程任务完成。

  2. 阻塞与非阻塞针对的是进程或线程:阻塞是当请求不能满足的时候就将进程挂起,而非阻塞则不会阻塞当前进程

 
原文地址:https://www.cnblogs.com/huangjm263/p/8400758.html