06_多线程

1.线程概述

1.线程是实现多任务编程的一种方法,可以使用计算机多核资源,是计算机核心分配的最小单位,线程由代码段,数据段,和TCB(线程控制块)组成

2.线程又称为轻量级进程,在创建和删除时消耗的计算机资源小,理论上创建和销毁线程的消耗是创建和销毁进程消耗的二十分之一

3.一个进程中的所有线程共享进程的空间资源(空间,全局变量,分配的内存等),进程中每个线程有自己的特有属性,如指令集TID等

4.多线程程序的执行顺序是不确定的,主线程会等待所有的子线程结束后才结束

5.计算机开启的线程数量建议: CPU核数 * 5

2.threading模块语法概述

import threading
t = thread.Thread()  # 创建线程并返回线程对象
    参数:
        target: 线程函数
        args: 给线程函数的位置参数(类型为元组)
        kwargs: 给线程函数的字典传参(类型为字典)
        name: 给线程取名字(默认为Thread-1)
t.start(): 启动线程
t.join(timeout): 回收线程
t.is_alive(): 查看线程状态
t.name: 查看线程名称
threading.currentThread(): 得到线程对象
t.setName(): 设置线程名称
t.daemon = True: 守护线程,默认为False主线程执行完毕不会影响分支线程的执行,True则表示主线程执行完毕其它线程也会终止
    设置方法: t.daemon = True 或者 t.setDaemon(True)
t.isDaemon(True): 判断daemon属性是 True or False

3.线程属性示例

from threading import Thread
from threading import currentThread
from time import sleep


def func(sec):
    print("线程属性测试")
    sleep(sec)
    print("%s线程结束" % currentThread().getName())


def main():
    thread = list()
    for i in range(3):
        t = Thread(name="t-" + str(i), target=func, args=(5,))

        # 设置deamon属性为True,此时主线程结束,子线程也会结束
        # t.setDaemon(True)  # 默认为False,主线程等待子线程结束
        print("isDaemon", t.isDaemon())
        # 也可以在定义后设置线程名称
        # t.setName = "t-" + str(i)
        t.start()
        thread.append(t)
    for i in thread:
        i.join(1)
        print("thread name:", i.name)
        print("alive:", i.is_alive())

    print("主线程结束")


if __name__ == '__main__':
    main()
"""执行结果
    isDaemon False
    线程属性测试
    isDaemon False
    线程属性测试
    isDaemon False
    线程属性测试
    thread name: t-0
    alive: True
    thread name: t-1
    alive: True
    thread name: t-2
    alive: True
    主线程结束
    t-0线程结束
    t-2线程结束
    t-1线程结束
"""

4.线程定时器

from threading import Timer  # 定时器


def func():
    print('此生一入IT们,从此不爱任何人!')


Timer(2.5, func).start()
# Timer(time, func)
# time: 睡眠的时间,以秒为单位
# func: 睡眠时间之后,需要执行的任务

5.验证守护线程

from threading import Thread
import time


def func():
    time.sleep(2)
    print(123)


def func1():
    time.sleep(1)
    print('abc')


# 守护线程不是根据主线程的代码执行结束而结束,而是根据主线程执行结束才结束
# 主线程会等待普通线程执行结束再结束,守护线程会等待主线程结束再结束,所以一般把不重要的事情设置为守护线程
# 守护进程是根据主进程的代码执行完毕,守护进程就结束
if __name__ == '__main__':
    t = Thread(target=func)
    t.daemon = True
    t.start()
    t1 = Thread(target=func1)
    t1.start()
    print(456)

6.自定义线程函数

# 将函数作为实参传递给线程类,通过线程类的实例化对象启动线程
import threading
import time


def sing():
    """唱歌5秒钟"""
    for i in range(5):
        print("---正在唱歌---%s" % i)
        time.sleep(1)


def dance():
    """跳舞10秒钟"""
    for i in range(10):
        print("---正在跳舞---%s" % i)
        time.sleep(1)


def main():
    # 创建线程
    t1 = threading.Thread(target=sing)
    t2 = threading.Thread(target=dance)
    # 启动线程
    t1.start()
    t2.start()

    for i in range(15):
        # 查看当前线程数量
        print(threading.enumerate())
        time.sleep(1)

    t1.join()  # 等待回收线程
    t2.join()  # 等待回收线程


if __name__ == "__main__":
    main()

7.自定义线程类

1.继承Thread类重写 run 方法

import threading
import time


# threading.Thread类有一个run方法,用于定义线程的功能函数,可以在自己的线程类中覆盖该方法
# 而创建自己的线程实例后,通过Thread类的start方法启动该线程
class MyThread(threading.Thread):
    def run(self):
        for i in range(3):
            time.sleep(1)
            msg = "I'm "+self.name+' @ '+str(i) #name属性中保存的是当前线程的名字
            print(msg)


if __name__ == "__main__":
    t = MyThread()
    t.start()

2.继承Thread类重写 run 方法和 __init__ 方法

from threading import Thread
from time import ctime
from time import sleep


class MyThread(Thread):
    def __init__(self, func, args, name="Tedu"):
        super().__init__()
        self.func = func
        self.args = args
        self.name = name

    def run(self):
        self.func(*self.args)

    @staticmethod  # 声明此方法是静态方法
    def plary(file, sec):
        for _ in range(sec):
            print("%s: %s" % (file, ctime()))
            sleep(sec)


def main():
    t = MyThread(MyThread.plary, ("echo", 3))
    t.start()
    t.join()


if __name__ == "__main__":
    main()
"""
    echo: Sun Jul 19 23:13:55 2020
    echo: Sun Jul 19 23:13:58 2020
    echo: Sun Jul 19 23:14:01 2020
"""

8.Python线程的全局解释器锁(GIL)

全局解释器锁-产生的原因

GIL是CPython解释器存在的问题
Python支持多线程同步互斥加锁超级锁但在同一时刻解释器只能解释一个线程
大量的Python库为了省事沿用了这种方法导致了Python多线程效率低下

全局解释器锁-用htop命令查看CPU占有率验证

1.单线程死循环

def main():
    # 主线程死循环
    while True:
        pass


if __name__ == "__main__":
    main()

2.多线程死循环

import threading


# 子线程死循环
def test():
    pass


def main():
    t1 = threading.Thread(target=test)
    t1.start()

    # 主线程死循环
    while True:
        pass


if __name__ == "__main__":
    main()

3.多进程死循环

import multiprocessing


# 子进程死循环
def test():
    pass


def main():
    p1 = multiprocessing.Process(target=test)
    p1.start()

    # 主进程死循环
    while True:
        pass


if __name__ == "__main__":
    main()

全局解释器锁-通过计算密集耗时和IO操作耗时验证

import time
import threading
import multiprocessing


# 计算密集
def calculation(num, x=1, y=1):
    for _ in range(num):
        x += 1
        y += 1


# IO密集-读写
def io_write_read(num):
    # IO密集-写
    f = open("./test.txt", "w")
    for _ in range(num):
        f.write("hello world!
")
    f.close()

    # IO密集-读
    f = open("./test.txt", "r")
    for _ in range(num):
        f.readline()
    f.close()


# 单任务耗时
def single_task_time(num, func):
    t_start = time.time()
    for _ in range(10):
        func(num)
    t_end = time.time() - t_start
    print("单线程CPU执行1亿次%s耗时: %s" % (func.__name__, t_end))


# 多线程耗时
def threading_time(num, func):
    t_start = time.time()
    counts = list()
    for _ in range(10):
        # t = threading.Thread(target=func, args=(num,), kwargs={"x": 1, "y": 1})
        t = threading.Thread(target=func, args=(num,))
        t.start()
        counts.append(t)
    for i in counts:
        i.join()
    t_end = time.time() - t_start
    print("10个线程CPU执行1亿次%s耗时: %s" % (func.__name__, t_end))


# 多进程耗时
def multiprocessing_time(num, func):
    t_start = time.time()
    counts = list()
    for _ in range(10):
        p = multiprocessing.Process(target=func, args=(num,))
        p.start()
        counts.append(p)
    for i in counts:
        i.join()
    t_end = time.time() - t_start
    print("10个进程CPU执行1亿次%s耗时: %s" % (func.__name__, t_end))


def main():
    # 单线程耗时
    single_task_time(5000000, calculation)  # 单线程CPU执行1亿次calculation耗时: 5.152180910110474
    single_task_time(5000000, io_write_read)  # 单线程CPU执行1亿次io_write_read耗时: 22.120678186416626
    # 多线程耗时
    threading_time(5000000, calculation)  # 10个线程CPU执行1亿次calculation耗时: 5.205517053604126
    threading_time(5000000, io_write_read)  # 10个线程CPU执行1亿次io_write_read耗时: 22.218310356140137
    # 多进程耗时
    multiprocessing_time(5000000, calculation)  # 10个进程CPU执行1亿次calculation耗时: 1.7116732597351074
    multiprocessing_time(5000000, io_write_read)  # 10个进程CPU执行1亿次io_write_read耗时: 6.813052177429199


if __name__ == "__main__":
    main()
"""执行结果
    单线程CPU执行1亿次calculation耗时: 5.335744142532349
    单线程CPU执行1亿次io_write_read耗时: 21.98353886604309
    10个线程CPU执行1亿次calculation耗时: 5.344666814804077
    10个线程CPU执行1亿次io_write_read耗时: 22.28637194633484
    10个进程CPU执行1亿次calculation耗时: 1.8069920539855957
    10个进程CPU执行1亿次io_write_read耗时: 7.141486167907715
"""

全局解释器锁-解决方法

1.不使用多线程,使用多进程
2.不使用C C++做的解释器,用 C# Java
3.Python多线程适合高用时的网络IO操作,不适用CPU密集型程序
4.使用其它语言实现多线程,Python去调用

GIL解决方案示例-C语言写子线程执行的函数由Python调用

loop.c文件代码

#include<stdio.h>

void DeadLoop()
{
    while(1)
    {
        ;
    }
}

int main(int argc, char **argv)
{
    printf("start DeadLoop
");
    DeadLoop();
    return 0;
}

命令行下编译C语言写的代码
gcc loop.c # 编译成功后当前目录先会生成一个a.out的可执行文件
gcc loop.c -shared -o libdead_loop.so # 执行命令把c语言文件编译成一个动态库文件
./a.out # 执行文件

Python调用编译后的C语言的动态库文件

import ctypes
import threading


def main():
    # 加载动态库
    lib = ctypes.cdll.LoadLibrary("libdead_loop.so")
    # 创建一个子线程,让子线程执行C语言写的死循环函数
    t = threading.Thread(target=lib.DeadLoop)
    t.start()


if __name__ == "__main__":
    main()

9.多线程-udp聊天器

import socket
import threading


def send_msg(udp_socket):
    """获取键盘数据,并将其发送给对方"""
    while True:
        # 1. 从键盘输入数据
        msg = input("
请输入要发送的数据:")
        # 2. 输入对方的ip地址
        dest_ip = input("
请输入对方的ip地址:")
        # 3. 输入对方的port
        dest_port = int(input("
请输入对方的port:"))
        # 4. 发送数据
        udp_socket.sendto(msg.encode("utf-8"), (dest_ip, dest_port))


def recv_msg(udp_socket):
    """接收数据并显示"""
    while True:
        # 1. 接收数据
        recv_msg = udp_socket.recvfrom(1024)
        # 2. 解码
        recv_ip = recv_msg[1]
        recv_msg = recv_msg[0].decode("utf-8")
        # 3. 显示接收到的数据
        print(">>>%s:%s" % (str(recv_ip), recv_msg))


def main():
    # 1. 创建套接字
    udp_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
    # 2. 绑定本地信息
    udp_socket.bind(("", 7890))

    # 3. 创建一个子线程用来接收数据
    t = threading.Thread(target=recv_msg, args=(udp_socket,))
    t.start()
    # 4. 让主线程用来检测键盘数据并且发送
    send_msg(udp_socket)


if __name__ == "__main__":
    main()

10.多线程-简单tcp服务器

from socket import *
import os
import sys
from threading import Thread


def client_handler(c):
    try:
        print("子线程接收%s客户端的请求" % str(c.getpeername()))
        while True:
            data = c.recv(1024)
            if not data:
                break
            print(data.decode("utf-8"))
            c.send(b"receive your message")
    except (KeyboardInterrupt, SystemError):
        raise
    except Exception as e:
        print(e)
    # 关闭客户端套接字
    c.close()


def main():
    # 创建套接字
    s = socket()
    # 端口重用
    s.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
    # 绑定本地信息
    s.bind(("", 7890))
    # 监听
    s.listen(128)
    print("主线程%d等待客户端的链接" % os.getpid())

    while True:
        try:
            c, addr = s.accept()
        except KeyboardInterrupt:
            raise
        except Exception as e:
            print(e)
            continue
        t = Thread(target=client_handler, args=(c,))
        t.setDaemon(True)  # 主线程执行完毕其它线程也会终止
        t.start()
    # 关闭监听套接字
    s.close()


if __name__ == "__main__":
    main()

11.多线程-简单tcp服务器的测试客户端

import socket


def main():
    # 创建数据流套接字
    tcp_client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    # 连接服务器
    server_ip = input("请输入要连接的服务器的ip:")
    serve_port = int(input("请输入要连接的服务器的port:"))
    server_addr = (server_ip, serve_port)
    tcp_client_socket.connect(server_addr)
    # 发送数据
    send_data = input("请输入要发生的数据:")
    tcp_client_socket.send(send_data.encode("utf-8"))
    # 接收服务器发送过来的数据
    recv_data = tcp_client_socket.recv(1024)
    print("接收到的数据为:%s" % recv_data.decode("utf-8"))
    # 关闭套接字
    tcp_client_socket.close()


if __name__ == "__main__":
    main()