一、OSI七层模型
互联网协议按照功能不同分为osi七层或tcp/ip五层或tcp/ip四层
二、socket介绍
2.1、socket位置
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的
2.2、socket分类
套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型:
1)基于文件类型的套接字家族
套接字家族的名字:AF_UNIX
2)基于网络类型的套接字家族
套接字家族的名字:AF_INET
2.3、socket工作流程
文字说明:服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束
socket()模块函数使用:
import socket socket.socket(socket_family,socket_type,protocal=0) #socket_family 可以是 AF_UNIX 或 AF_INET。socket_type 可以是 SOCK_STREAM(基于TCP) 或 SOCK_DGRAM(基于UDP)。protocol 一般不填,默认值为 0。 #获取tcp/ip套接字 tcpSock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) #获取udp/ip套接字 udpSock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM) #由于socket 模块中有太多的属性使用'from module import *'语句。使用 'from socket import *',我们就把 socket 模块里的所有属性都带到我们的命名空间里了,这样能大幅减短我们的代码。 tcpSock = socket(AF_INET, SOCK_STREAM)
三、基于TCP的套接字
tcp三次握手与四次挥手:
tcp是基于连接的,必须先起启动服务端,然后在启动客户端取连接服务端
tcp服务端:
from socket import * ip_port=('127.0.0.1',8080) back_log=5 #连接池 buffer_size=1024 #接受的字节数 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) while True: #==>循环接受客户端的连接 print('服务端开始运行了') conn,addr=tcp_server.accept() #服务端阻塞,等待客户端来连接 print('双向链接是',conn) print('客户端地址',addr) while True: #==>基于一次连接收发数据 # try: data=conn.recv(buffer_size) print('客户端发来的消息是',data.decode('utf-8')) conn.send(data.upper()) # except Exception: # break conn.close() tcp_server.close()
tcp客户端:
from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) while True: msg=input('>>: ').strip() if not msg:continue #如何输入空,持续输入,否则服务端接受不了空数据 tcp_client.send(msg.encode('utf-8')) print('客户端已经发送消息') data=tcp_client.recv(buffer_size) print('收到服务端发来的消息',data.decode('utf-8')) tcp_client.close()
注意:当重启服务器(linux等),会出现如下状况,同时服务器会出现time_wait2状态
解决方法:
方法一:==>立刻就可以启动
#加入一条socket配置,重用ip和端口 socket_server=socket(AF_INET,SOCK_STREAM) socket_server.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) #在bind前加 socket_server.bind(('127.0.0.1',8080))
方法二:==>centos7测试不行
#发现系统存在大量TIME_WAIT状态的连接,通过调整linux内核参数解决, vi /etc/sysctl.conf #编辑文件,加入以下内容: net.ipv4.tcp_syncookies = 1 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_tw_recycle = 1 net.ipv4.tcp_fin_timeout = 30 #然后执行 /sbin/sysctl -p 让参数生效。 net.ipv4.tcp_syncookies = 1 #表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭; net.ipv4.tcp_tw_reuse = 1 #表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭; net.ipv4.tcp_tw_recycle = 1 #表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。 net.ipv4.tcp_fin_timeout #修改系統默认的 TIMEOUT 时间
四、基于UDP的套接字
udp是无连接的,先启动哪一端都不会报错
服务端:
from socket import * ip_port=('127.0.0.1',8080) buffer_size=1024 udp_server=socket(AF_INET,SOCK_DGRAM) #数据报 udp_server.bind(ip_port) while True: data,addr=udp_server.recvfrom(buffer_size) print(data) udp_server.sendto(data.upper(),addr)
客户端:
from socket import * ip_port=('127.0.0.1',8080) buffer_size=1024 udp_client=socket(AF_INET,SOCK_DGRAM) #数据报 while True: msg=input('>>: ').strip() udp_client.sendto(msg.encode('utf-8'),ip_port) data,addr=udp_client.recvfrom(buffer_size) # print(data.decode('utf-8')) print(data)
五、模拟QQ聊天
服务端:
import socket ip_port=('127.0.0.1',8081) udp_server_sock=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) udp_server_sock.bind(ip_port) while True: qq_msg,addr=udp_server_sock.recvfrom(1024) print('来自[%s:%s]的一条消息: 33[1;44m%s 33[0m' %(addr[0],addr[1],qq_msg.decode('utf-8'))) back_msg=input('回复消息: ').strip() udp_server_sock.sendto(back_msg.encode('utf-8'),addr)
客户端1:
import socket BUFSIZE=1024 udp_client_socket=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) qq_name_dic={ 'A':('127.0.0.1',8081), 'B':('127.0.0.1',8081), 'C':('127.0.0.1',8081), 'D':('127.0.0.1',8081), } while True: qq_name=input('请选择聊天对象: ').strip() while True: msg=input('请输入消息,回车发送: ').strip() if msg == 'quit':break if not msg or not qq_name or qq_name not in qq_name_dic:continue udp_client_socket.sendto(msg.encode('utf-8'),qq_name_dic[qq_name]) back_msg,addr=udp_client_socket.recvfrom(BUFSIZE) print('来自[%s:%s]的一条消息: 33[1;44m%s 33[0m' %(addr[0],addr[1],back_msg.decode('utf-8'))) udp_client_socket.close()
客户端2:
import socket BUFSIZE=1024 udp_client_socket=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) qq_name_dic={ 'A':('127.0.0.1',8081), 'B':('127.0.0.1',8081), 'C':('127.0.0.1',8081), 'D':('127.0.0.1',8081), } while True: qq_name=input('请选择聊天对象: ').strip() while True: msg=input('请输入消息,回车发送: ').strip() if msg == 'quit':break if not msg or not qq_name or qq_name not in qq_name_dic:continue udp_client_socket.sendto(msg.encode('utf-8'),qq_name_dic[qq_name]) back_msg,addr=udp_client_socket.recvfrom(BUFSIZE) print('来自[%s:%s]的一条消息: 33[1;44m%s 33[0m' %(addr[0],addr[1],back_msg.decode('utf-8'))) udp_client_socket.close()
六、时间服务器
服务端:
import time ip_port=('127.0.0.1',8080) buffer_size=1024 udp_server=socket(AF_INET,SOCK_DGRAM) #数据报 udp_server.bind(ip_port) while True: data,addr=udp_server.recvfrom(buffer_size) print(data) if not data: fmt='%Y-%m-%d %X' else: fmt=data.decode('utf-8') back_time=time.strftime(fmt) udp_server.sendto(back_time.encode('utf-8'),addr)
客户端:
from socket import * ip_port=('127.0.0.1',8080) buffer_size=1024 udp_client=socket(AF_INET,SOCK_DGRAM) #数据报 while True: msg=input('>>: ').strip() udp_client.sendto(msg.encode('utf-8'),ip_port) data,addr=udp_client.recvfrom(buffer_size) print('ntp服务器的标准时间是',data.decode('utf-8'))
七、基于tcp实现远程命令
服务端:
from socket import * import subprocess ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) while True: conn,addr=tcp_server.accept() print('新的客户端链接',addr) while True: #收 try: #当客户端非正常断开会报异常 cmd=conn.recv(buffer_size) if not cmd:break #客户端正常断开后,会一直收空 print('收到客户端的命令',cmd) # 执行命令,得到命令的运行结果cmd_res res=subprocess.Popen(cmd.decode('utf-8'),shell=True, stderr=subprocess.PIPE, stdout=subprocess.PIPE, stdin=subprocess.PIPE) err=res.stderr.read() #先判断是否有错误输出 if err: cmd_res=err else: cmd_res=res.stdout.read() #发 if not cmd_res: #如果客户端执行没有输出,表示执行成功(cd ..) cmd_res='执行成功'.encode('gbk') conn.send(cmd_res) except Exception as e: print(e) break
客户端:
from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) while True: cmd=input('>>: ').strip() if not cmd:continue if cmd == 'quit':break tcp_client.send(cmd.encode('utf-8')) cmd_res=tcp_client.recv(buffer_size) print('命令的执行结果是 ',cmd_res.decode('gbk')) #subprocess默认使用系统的字符集gbk tcp_client.close()
注意:当使用基于TCP制作远程执行命令程序时,当执行dir,ipconfig等命令时会出现粘包
八、基于udp实现远程命令
基于udp的socket在运行时不会发生粘包
服务端和客户端可以在linux服务器上运行,在windows上报:OSError: [WinError 10040] 一个在数据报套接字上发送的消息大于内部消息缓冲区或其他一些网络限制,或该用户用于接收数据报的缓冲区比数据报小。
服务端:
#!/usr/bin/env python # -*- coding: utf-8 -*- from socket import * import subprocess ip_port=('10.0.0.12',8080) back_log=5 buffer_size=1024 udp_server=socket(AF_INET,SOCK_DGRAM) udp_server.bind(ip_port) while True: #收 cmd,addr=udp_server.recvfrom(buffer_size) # 执行命令,得到命令的运行结果cmd_res res = subprocess.Popen(cmd.decode('utf-8'), shell=True, stderr=subprocess.PIPE, stdout=subprocess.PIPE, stdin=subprocess.PIPE) err = res.stderr.read() if err: cmd_res = err else: cmd_res = res.stdout.read() if not cmd_res: cmd_res='执行成功'.encode('gbk') #发 udp_server.sendto(cmd_res,addr)
客户端:
from socket import * ip_port=('10.0.0.12',8080) back_log=5 buffer_size=1024 udp_client=socket(AF_INET,SOCK_DGRAM) while True: cmd=input('>>: ').strip() if not cmd:continue if cmd == 'quit':break udp_client.sendto(cmd.encode('utf-8'),ip_port) cmd_res,addr=udp_client.recvfrom(buffer_size) print('命令的执行结果是 ',cmd_res.decode('gbk')) udp_client.close()
九、粘包
只有TCP有粘包现象,UDP永远不会粘包
9.1 、socket收发消息原理
1)发送端可以是一K一K地发送数据,而接收端的应用程序可以两K两K地提走数据,当然也有可能一次提走3K或6K数据,或者一次只提走几个字节的数据,也就是说,应用程序所看到的数据是一个整体,或说是一个流(stream),一条消息有多少字节对应用程序是不可见的,因此TCP协议是面向流的协议,这也是容易出现粘包问题的原因。而UDP是面向消息的协议,每个UDP段都是一条消息,应用程序必须以消息为单位提取数据,不能一次提取任意字节的数据,这一点和TCP是很不同的。怎样定义消息呢?可以认为对方一次性write/send的数据为一个消息,需要明白的是当对方send一条信息的时候,无论底层怎样分段分片,TCP协议层会把构成整条消息的数据段排序完成后才呈现在内核缓冲区。
2)例如基于tcp的套接字客户端往服务端上传文件,发送时文件内容是按照一段一段的字节流发送的,在接收方看了,根本不知道该文件的字节流从何处开始,在何处结束
3)所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。
4)udp的recvfrom是阻塞的,一个recvfrom(x)必须对唯一一个sendinto(y),收完了x个字节的数据就算完成,若是y>x数据就丢失,这意味着udp根本不会粘包,但是会丢数据,不可靠
5)tcp的协议数据不会丢,没有收完包,下次接收,会继续上次继续接收,己端总是在收到ack时才会清除缓冲区内容。数据是可靠的,但是会粘包。
9.2、粘包产生的情形
情形一:
发送端需要等缓冲区满才发送出去,造成粘包(发送数据时间间隔很短,数据量很小,会合到一起,产生粘包)
#服务端测试 from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) conn,addr=tcp_server.accept() data1=conn.recv(buffer_size) print('第一次数据',data1) data2=conn.recv(buffer_size) print('第2次数据',data2) data3=conn.recv(buffer_size) print('第3次数据',data3) #++++++++++++++++++++++++++++++++++++++++++ #客户端测试 from socket import * import time ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) tcp_client.send('hello'.encode('utf-8')) tcp_client.send('world'.encode('utf-8')) tcp_client.send('egon'.encode('utf-8')) # time.sleep(1000) #++++++++++++++++++++++++++++++++++++++++++++ #结果 第一次数据 b'helloworldegon' #一起接受 第2次数据 b'' 第3次数据 b''
情形二:
接收方不及时接收缓冲区的包,造成多个包接收(客户端发送了一段数据,服务端只收了一小部分,服务端下次再收的时候还是从缓冲区拿上次遗留的数据,产生粘包)
#服务端测试 from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) conn,addr=tcp_server.accept() data1=conn.recv(1) print('第一次数据',data1) data2=conn.recv(5) print('第2次数据',data2) data3=conn.recv(1) print('第3次数据',data3) #+++++++++++++++++++++++++++++++++++++++++ #客户端测试 from socket import * import time ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) tcp_client.send('helloworldegon'.encode('utf-8')) # time.sleep(1000) #+++++++++++++++++++++++++++++++++++++++++ #结果 第一次数据 b'h' 第2次数据 b'ellow' 第3次数据 b'o'
====================================================================
1)拆包的发生情况
当发送端缓冲区的长度大于网卡的MTU时,tcp会将这次发送的数据拆成几个数据包发送出去。
2)为何tcp是可靠传输,udp是不可靠传输
tcp在数据传输时,发送端先把数据发送到自己的缓存中,然后协议控制将缓存中的数据发往对端,对端返回一个ack=1,发送端则清理缓存中的数据,对端返回ack=0,则重新发送数据,所以tcp是可靠的
udp发送数据,对端是不会返回确认信息的,因此不可靠
3)send(字节流)和recv(1024)及sendall
recv里指定的1024意思是从缓存里一次拿出1024个字节的数据
send的字节流是先放入己端缓存,然后由协议控制将缓存内容发往对端,如果待发送的字节流大小大于缓存剩余空间,那么数据丢失,用sendall就会循环调用send,数据不会丢失
====================================================================
9.3、粘包解决思路
问题的根源在于,接收端不知道发送端将要传送的字节流的长度,所以解决粘包的方法就是围绕,如何让发送端在发送数据前,把自己将要发送的字节流总大小让接收端知晓,然后接收端来一个死循环接收完所有数据
9.3.1、方法一
服务端:
from socket import * import subprocess ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) while True: conn,addr=tcp_server.accept() print('新的客户端链接',addr) while True: #收 try: cmd=conn.recv(buffer_size) #接受客户端传过来的命令 if not cmd:break print('收到客户端的命令',cmd) #执行命令,得到命令的运行结果cmd_res res=subprocess.Popen(cmd.decode('utf-8'),shell=True, stderr=subprocess.PIPE, stdout=subprocess.PIPE, stdin=subprocess.PIPE) err=res.stderr.read() #读取错误管道内容 if err: cmd_res=err else: cmd_res=res.stdout.read() #发,如客户端输入cd ..命令,此时没有返回值,给他指定返回值,否则客户端会卡住 if not cmd_res: cmd_res='执行成功'.encode('gbk') length=len(cmd_res) conn.send(str(length).encode('utf-8')) #将命令结果长度返回给客户端 client_ready=conn.recv(buffer_size) #接受客户端发过来的ready if client_ready == b'ready': conn.send(cmd_res) #发送内容 except Exception as e: print(e) break
客户端:
from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) while True: cmd=input('>>: ').strip() if not cmd:continue if cmd == 'quit':break tcp_client.send(cmd.encode('utf-8')) #解决粘包 length=tcp_client.recv(buffer_size) #接受服务端发过来的长度 tcp_client.send(b'ready') length=int(length.decode('utf-8')) #当客户端不能一次性接受所有内容时 recv_size=0 recv_msg=b'' while recv_size < length: recv_msg += tcp_client.recv(buffer_size) recv_size=len(recv_msg) print('命令的执行结果是 ',recv_msg.decode('gbk')) tcp_client.close()
缺点: 程序的运行速度远快于网络传输速度,所以在发送一段字节前,先用send去发送该字节流长度,这种方式会放大网络延迟带来的性能损耗
9.3.2、方法二:使用struct模块
为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头,然后再取真实数据
struct模块:该模块可以把一个类型,如数字,转成固定长度的bytes
参考文档:https://www.cnblogs.com/coser/archive/2011/12/17/2291160.html
>>> import struct >>> struct.pack("i",12) b'x0cx00x00x00' >>> l=struct.pack("i",12) >>> len(l) 4 >>> struct.unpack("i",l) (12,) >>> type(struct.unpack("i",l)) <class 'tuple'>
服务端:
from socket import * import subprocess import struct ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_server=socket(AF_INET,SOCK_STREAM) tcp_server.bind(ip_port) tcp_server.listen(back_log) while True: conn,addr=tcp_server.accept() print('新的客户端链接',addr) while True: #收 try: cmd=conn.recv(buffer_size) if not cmd:break print('收到客户端的命令',cmd) #执行命令,得到命令的运行结果cmd_res res=subprocess.Popen(cmd.decode('utf-8'),shell=True, stderr=subprocess.PIPE, stdout=subprocess.PIPE, stdin=subprocess.PIPE) err=res.stderr.read() if err: cmd_res=err else: cmd_res=res.stdout.read() #发 if not cmd_res: cmd_res='执行成功'.encode('gbk') length=len(cmd_res) data_length=struct.pack('i',length) #将长度转换为4个字节,客户端只需要先收4个字节就行 conn.send(data_length) #发送长度,4个字节 conn.send(cmd_res) #发送内容 except Exception as e: print(e) break
客户端:
from socket import * import struct # from functools import partial ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) while True: cmd=input('>>: ').strip() if not cmd:continue if cmd == 'quit':break tcp_client.send(cmd.encode('utf-8')) #解决粘包 length_data=tcp_client.recv(4) #接受4个字节,即发过来的长度 length=struct.unpack('i',length_data)[0] #解码 recv_size=0 recv_msg=b'' while recv_size < length: recv_msg += tcp_client.recv(buffer_size) recv_size=len(recv_msg) print('命令的执行结果是 ',recv_msg.decode('gbk')) tcp_client.close()
十、socketserver实现并发
可以查看socketserver源码,查看继承关系
服务端:
import socketserver class MyServer(socketserver.BaseRequestHandler): def handle(self): print('conn is: ',self.request) #conn print('addr is: ',self.client_address) #addr while True: try: #收消息 data=self.request.recv(1024) if not data:break print('收到客户端的消息是',data,self.client_address) #发消息 self.request.sendall(data.upper()) except Exception as e: print(e) break if __name__ == '__main__': s=socketserver.ThreadingTCPServer(('127.0.0.1',8080),MyServer) #多线程 # s=socketserver.ForkingTCPServer(('127.0.0.1',8080),MyServer) #多进程 s.serve_forever()
客户端:
from socket import * ip_port=('127.0.0.1',8080) back_log=5 buffer_size=1024 tcp_client=socket(AF_INET,SOCK_STREAM) tcp_client.connect(ip_port) while True: msg=input('>>: ').strip() if not msg:continue #如何输入空,持续输入,否则服务端接受不了空数据 tcp_client.send(msg.encode('utf-8')) print('客户端已经发送消息') data=tcp_client.recv(buffer_size) print('收到服务端发来的消息',data.decode('utf-8')) tcp_client.close()