## 进程及并发的产生 ```python 进程指的是正在运行的程序,是一系列过程的统称,也是操作系统在调度和进行资源分配的基本单位 并发,指的是多个任务同时被执行,并发编程指的是编写支持多任务并发的应用程序在。(看似同时执行,因为cpu得任务切换很快) '并行:是真正意义上的多任务同时被执行。 '进程这个概念来自于操作系统,没有操作系统就没有进程 # 操作系统的两个核心作用 1.为用户屏蔽了复杂繁琐的硬件接口,为应用程序提供了,清晰易用的系统接口 有了这些接口以后程序员不用再直接与硬件打交道了 2.操作系统将应用程序对硬件资源的竞争变成有序的使用 # 操作系统与应用程序的区别 二者的区别不在于的地位,它们都是软件,而操作系统可以看做一款特殊的软件 1.操作系统是是受保护的:无法被用户修改(应用软件如qq不属于操作系统可以随便卸载) 2.大型:linux或widows源代码都在五百万行以上,这仅仅是内核,不包括用户程序,如GUI,库以及基本应用软件(如windows Explorer等),很容易就能达到这个数量的10倍或者20倍之多 3.长寿:由于操作系统源码量巨大,编写是非常耗时耗力的,一旦完成,操作系统所有者便不会轻易的放弃重写,二是在原有基础上改进,基本上可以把windows95/98/Me看出一个操作系统 第三代计算机产生了多道技术 多进程实现得原理:多道技术 多道技术:1,空间上得复用 2,时间上的复用 ``` ## PID禾PPID ```python # PID 在一个操作系统中通常都会运行多个应用程序,也就是多个进程,那么如何来区分进程呢? 系统会给每一个进程分配一个进程编号即PID,如同人需要一个身份证号来区分。 验证: tasklist 用于查看所有的进程信息 taskkill /f /pid pid 该命令可以用于结束指定进程 # 在python中可以使用os模块来获取pid import os print(os.getpid()) # PPID 当一个进程a开启了另一个进程b时,a称为b的父进程,b称为a的子进程 在python中可以通过os模块来获取父进程的pid # 在python中可以使用os模块来获取ppid import os print("self",os.getpid()) # 当前进程自己的pid print("parent",os.getppid()) # 当前进程的父进程的pid 如果是在pycharm中运行的py文件,那pycahrm就是这个python.exe的父进程,当然你可以从cmd中来运行py文件,那此时cmd就是python.exe的父进程 ``` ## 阻塞与非阻塞 ```python # 阻塞与非阻塞指的是程序的状态 阻塞状态是因为程序遇到了IO操作,或是sleep,导致后续的代码不能被CPU执行 非阻塞与之相反,表示程序正在正常被CPU执行 补充:进程有三种状态 就绪态,运行态,和阻塞态 多道技术会在进程执行时间过长或遇到IO时自动切换其他进程,意味着IO操作与进程被剥夺CPU执行权都会造成进程无法继续执行 ``` ## python中实现多进程的两种方式 ### 方式1: ### 实例化Process类 ```python from multiprocessing import Process import time def task(name): print('%s is running' %name) time.sleep(3) print('%s is done' %name) if __name__ == '__main__': # 在windows系统之上,开启子进程的操作一定要放到这下面 # Process(target=task,kwargs={'name':'egon'}) p=Process(target=task,args=('jack',)) p.start() # 向操作系统发送请求,操作系统会申请内存空间,然后把父进程的数据拷贝给子进程,作为子进程的初始状态 print('======主') ``` ### 方式2: ### 继承Process类 并覆盖run方法 ```python from multiprocessing import Process import time class MyProcess(Process): def __init__(self,name): super(MyProcess,self).__init__() self.name=name def run(self): print('%s is running' %self.name) time.sleep(3) print('%s is done' %self.name) if __name__ == '__main__': p=MyProcess('jack') p.start() print('主') ``` 需要注意的是 1.在windows下 开启子进程必须放到`__main__`下面,因为windows在开启子进程时会重新加载所有的代码造成递归创建进程(发生了导入) 2.第二种方式中,必须将要执行的代码放到run方法中,子进程只会执行run方法其他的一概不管 ### join函数 调用start函数后的操作就由操作系统来玩了,至于何时开启进程,进程何时执行,何时结束都与应用程序无关,所以当前进程会继续往下执行,join函数就可以是父进程等待子进程结束后继续执行 案例 ```python from multiprocessing import Process import time x=1000 def task(): time.sleep(3) global x x=0 print('儿子死啦',x) if __name__ == '__main__': p=Process(target=task) p.start() p.join() # 让父亲在原地等 print(x) ``` ## Process对象常用属性 ```PYTHON from multiprocessing import Process def task(n): print('%s is runing' %n) time.sleep(n) if __name__ == '__main__': start_time=time.time() p1=Process(target=task,args=(1,),name='任务1') p1.start() # 启动进程 print(p1.pid) # 获取进程pid print(p1.name) # 获取进程名字 p1.terminate() # 终止进程 p1.join() # 提高优先级 print(p1.is_alive()) # 获取进程的存活状态 print('主') ``` # 孤儿进程与僵尸进程(了解) #### 什么是孤儿进程 孤儿进程指的是开启子进程后,父进程先于子进程终止了,那这个子进程就称之为孤儿进程 例如:qq聊天中别人发给你一个链接,点击后打开了浏览器,那qq就是浏览器的父进程,然后退出qq,此时浏览器就成了孤儿进程 孤儿进程是无害的,有其存在的必要性,在父进程结束后,其子进程会被操作系统接管。 #### 什么是僵尸进程 僵尸进程指的是,当子进程比父进程先结束,而父进程又没有回收子进程,释放子进程占用的资源,此时子进程将成为一个僵尸进程。如果父进程先退出 ,子进程被操作系统接管,子进程退出后操作系统会回收其占用的相关资源! #### 僵尸进程的危害: 由于子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程 到底什么时候结束. 那么会不会因为父进程太忙来不及wait子进程,或者说不知道 子进程什么时候结束,而丢失子进程结束时的状态信息呢? 不会。因为UNⅨ提供了一种机制可以保证只要父进程想知道子进程结束时的状态信息, 就必然可以得到。这种机制就是: 在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination status of the process,运行时间the amount of CPU time taken by the process等)。直到父进程通过wait / waitpid来取时才释放. 但这样就导致了问题,如果进程不调用wait / waitpid的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生[僵死进程],将因为没有可用的进程号而导致系统不能产生新的进程. 此为僵尸进程的危害,应当避免。