Python的进程和线程（一）—

Python的进程和线程（一）——计算密集型任务

Python的进程和线程

1、什么是进程

对于操作系统来说，一个任务就是一个进程（Process）。比如打开一个浏览器就是启动一个浏览器进程，打开一个记事本就启动了一个记事本进程。

由于每个进程至少要干一件事，所以，一个进程至少有一个线程，即主线程。

2、什么是线程

有些进程还不止同时干一件事，比如Word，它可以同时进行打字、拼写检查、打印等事情。在一个进程内部，要同时干多件事，就需要同时运行多个“子任务”，我们把进程内的这些“子任务”称为线程（Thread）。同一个进程的不同线程之间共享Memary，不同的线程之间申请缩的过程，称为线程的数据的同步。

不同的进程之间的Mem是相互独立的，一般通过管道或者队列来进行通信。

并行编程解决的问题，大部分可以理解为进程之间通信、线程之间同步的问题

3、Python的多进程包multiprocessing

使用的一般步骤如下：

#1. 导入包
from multiprocessing import Process

#2. 实例化对象
a=Process(target=func,args=(args,)) 
#3. 开始运行 
a.start() 
#4. 等待终止 
a.join()

实例化对象，target是指的要让线程执行的任务的函数名，args参数传入函数的参数，元祖格式

4、Python的多线程包threading

#导入包
from threading import Thread

#实例化对象
a=Thread(target=func,args=(args,)) 
#开始运行 
a.start() 
#等待终止 
a.join()

5、并行编程——计算密集型任务举例

假如我们要实现一个函数把COUNT减少到1，分别用多进程和多线程来实现，看一下运行时间

from threading import Thread
from multiprocessing import Process
import time

def countdown(n):
    while n > 0:
        n -= 1
COUNT = 100000000


def thread_process_job(n, Thread_Process, job):
    """
    n: 多线程或多进程数
    Thread_Process: Thread／Process类
    job: countdown任务
    """
    local_time = time.time()

    # 实例化多线程或多进程
    threads_or_processes = [Thread_Process(target=job, args=(COUNT // n,)) for i in range(n)]
    for t in threads_or_processes:
        t.start()  # 开始线程或进程，必须调用
    for t in threads_or_processes:
        t.join()  # 等待直到该线程或进程结束

    print(n, Thread_Process.__name__, " run job need ", time.time() - local_time)


if __name__ == "__main__":
    print( "Multi Threads")
    for i in [1, 2, 4]:
        thread_process_job(i, Thread, countdown)

    print("Multi Process")
    for i in [1, 2, 4]:
        thread_process_job(i, Process, countdown)

在我的电脑上的运行结果如下：

可以看出，多线程的情况，当2个线程、4个线程并没有比1个线程使用的时间明显减少，2个线程的情况用时反而更长。

为什么多线程反而慢了？

计算密集型任务，占用的是CPU的时间，Python多线程之间有一个调度问题，全局解释器锁GIL。当有多个线程的时候，线程并不是并行在运行，他会申请一个全局解释器锁，谁申请到了，谁运行。线程在串行运行，所以并没有加快。

当电脑有多核的时候，进程是并行运行的，所以时间会缩短。

6、参考资料

廖雪峰的官方网站