python进程基础

进程以及状态

1. 进程

程序:例如xxx.py这是程序,是一个静态的

进程:一个程序运行起来后,代码+用到的资源 称之为进程,它是操作系统分配资源的基本单元。

不仅可以通过线程完成多任务,进程也是可以的

2. 进程的状态

工作中,任务数往往大于cpu的核数,即一定有一些任务正在执行,而另外一些任务在等待cpu进行执行,因此导致了有了不同的状态。

  • 就绪态:运行的条件都已经满足,正在等在cpu执行
  • 执行态:cpu正在执行其功能
  • 等待态:等待某些条件满足,例如一个程序sleep了,此时就处于等待态

进程的创建-multiprocessing

multiprocessing模块就是跨平台版本的多进程模块,提供了一个Process类来代表一个进程对象,这个对象可以理解为是一个独立的进程,可以执行另外的事情

1. 创建进程

import multiprocessing
import time


def test():

        while True:
                print("--test--")
                time.sleep(1)

if __name__ == "__main__":

        p = multiprocessing.Process(target=test)
        p.start()

        while True:
                print("--main--")
                time.sleep(1)   
                

说明:

  • 创建子进程时,只需要传入一个执行函数和函数的参数,创建一个Process实例,用start()方法启动

2. 进程pid

import multiprocessing
import os


def test():

        print("子进程在运行,pid=%d" % (os.getpid()))
        print("子进程运行结束")


if __name__ == "__main__":

        print("父进程在运行,pid=%d" % (os.getpid()))
        p = multiprocessing.Process(target=test)
        p.start()    

通过os中的getpid()方法能获取到当前运行进程的id。

3. Process语法结构如下

Process([group [, target [, name [, args [, kwargs]]]]])

  • target:如果传递了函数的引用,可以认为这个子进程就执行这里的代码
  • args:给target指定的函数传递的参数,以元组的方式传递
  • kwargs:给target指定的函数传递命名参数
  • name:给进程设定一个名字,可以不设定
  • group:指定进程组,大多数情况下用不到

Process创建的实例对象的常用方法:

  • start():启动子进程实例(创建子进程)
  • is_alive():判断进程子进程是否还在活着
  • join([timeout]):是否等待子进程执行结束,或等待多少秒
  • terminate():不管任务是否完成,立即终止子进程

Process创建的实例对象的常用属性:

  • name:当前进程的别名,默认为Process-N,N为从1开始递增的整数
  • pid:当前进程的pid(进程号)

4. 给子进程指定的函数传递参数

import multiprocessing
import os
import time


def test(name, **kwargs):
    
        for i in range(10):
                print("子进程在运行,name=%s, pid=%d" % (name, os.getpid()))
                print(kwargs)
                time.sleep(0.2)


if __name__ == "__main__":

        p = multiprocessing.Process(target=test, args=("zhangsan",), kwargs={"xxoo": 666})
        p.start()    
    
        time.sleep(1)
    
        p.terminate()
        p.join()

运行结果:

子进程在运行,name=zhangsan, pid=37751
{'xxoo': 666}
子进程在运行,name=zhangsan, pid=37751
{'xxoo': 666}
子进程在运行,name=zhangsan, pid=37751
{'xxoo': 666}
子进程在运行,name=zhangsan, pid=37751
{'xxoo': 666}
子进程在运行,name=zhangsan, pid=37751
{'xxoo': 666}

5. 进程间不共享全局变量

import multiprocessing
import os
import time


g_nums = [11, 33] 


def test1():
        """子进程要执行的代码"""
        print("in test1, pid=%d, g_nums=%s", (os.getpid(), g_nums))
        for i in range(4):
                g_nums.append(i)
                time.sleep(1)
                print("in test1, pid=%d, g_nums=%s", (os.getpid(), g_nums))



def test2():
        """子进程要执行的代码"""
        print("in test2, pid=%d, g_nums=%s", (os.getpid(), g_nums))


if __name__ == "__main__":

        p1 = multiprocessing.Process(target=test1)
        p1.start()
        p1.join()

        p2 = multiprocessing.Process(target=test2)
        p2.start()

运行结果:

in test1, pid=%d, g_nums=%s (37947, [11, 33])
in test1, pid=%d, g_nums=%s (37947, [11, 33, 0])
in test1, pid=%d, g_nums=%s (37947, [11, 33, 0, 1])
in test1, pid=%d, g_nums=%s (37947, [11, 33, 0, 1, 2])
in test1, pid=%d, g_nums=%s (37947, [11, 33, 0, 1, 2, 3])
in test2, pid=%d, g_nums=%s (37948, [11, 33])

进程和线程对比

功能

  • 进程,能够完成多任务,比如 在一台电脑上能够同时运行多个QQ
  • 线程,能够完成多任务,比如 一个QQ中的多个聊天窗口

定义的不同

  • 进程是系统进行资源分配和调度的一个独立单位.
  • 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源.

区别

  • 一个程序至少有一个进程,一个进程至少有一个线程.
  • 线程的划分尺度小于进程(资源比进程少),使得多线程程序的并发性高。
  • 进程在执行过程中拥有独立的内存单元,而多个线程共享内存,从而极大地提高了程序的运行效率
  • 线程不能够独立执行,必须依存在进程中
  • 可以将进程理解为工厂中的一条流水线,而其中的线程就是这个流水线上的工人

优缺点

线程和进程在使用上各有优缺点:线程执行开销小,但不利于资源的管理和保护;而进程正相反。

原文地址:https://www.cnblogs.com/zhangfengxian/p/python-process-basic.html