Python socket 粘包

目录

1 TCP的三次握手四次挥手

1.1 三次握手

1 客户端向服务端发起SYN请求,请求建立连接,

2 服务端同意建立连接,回应ACK,同时服务端向客户端发起SYN请求

3 客户端回应ACK

1.2 四次挥手

挥手是任意的,客户端和服务端都可以首先断开连接

下面是以客户端发起的挥手

1 客户端发送完数据后发起FIN 请求,之后直接断开,
2 服务端返回一个ACK
3此时服务端还没有接收完数据,所以没有断开连接,接收完后,服务端想要断开,发送FIN

4 客户端返回ACK,结束

现实中的是TIME WAIT大量存在于服务端,是服务端主动断开连接,它在等待客户端发送ACK

总结

1 为什么建立连接协议是三次握手,而关闭连接却是四次握手呢?

这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(ACK起应答作用,而SYN起同步作用)放在一个报文里来发送。但关闭连接时,当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后,再发送FIN报文给对方来表示你同意现在可以关闭连接了,所以它这里的ACK报文和FIN报文多数情况下都是分开发送的.

2 为什么TIME_WAIT状态还需要等2MSL后才能返回到CLOSED状态

这是因为虽然双方都同意关闭连接了,而且握手的4个报文也都协调和发送完毕,按理可以直接回到CLOSED状态(就好比从SYN_SEND状态到ESTABLISH状态那样);但是因为我们必须要假想网络是不可靠的,你无法保证你最后发送的ACK报文会一定被对方收到,因此对方处于LAST_ACK状态下的SOCKET可能会因为超时未收到ACK报文,而重发FIN报文,所以这个TIME_WAIT状态的作用就是用来重发可能丢失的ACK报文。

3 TIMEWAIT的作用?

主动关闭的Socket端会进入TIME_WAIT状态,并且持续2MSL时间长度,MSL就是maximum segment lifetime(最大分节生命期),这是一个IP数据包能在互联网上生存的最长时间,超过这个时间将在网络中消失。MSL在RFC 1122上建议是2分钟,而源自berkeley的TCP实现传统上使用30秒,因而,TIME_WAIT状态一般维持在1-4分钟。

[TCP资料](http://blog.csdn.net/u011726984/article/details/50781212

2 粘包现象

粘包存在两个方面,一个是服务端,一个是客户端

2.1 基于TCP制作远程执行命令操作(win服务端)

下面是服务端放在本地win平台,用127.0.0.1自己测试的代码

服务端

# coding:utf-8
# 基于TCP制作的远程执行命令的操作
# version;版本1
# 问题:有粘包现象


import socket
import subprocess

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# family=AF_INET, type=SOCK_STREAM, proto=0, _sock=None)   # 买手机
# phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)  # 就是它,在bind前加
phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)


phone.bind(('127.0.0.1', 8888))   # 绑定手机卡
phone.listen(5)  # 开机 相当于挂起的电话连接

print("starting...")

while True:   # 通信循环
    conn, addr = phone.accept()  # 等待电话连接
    while True:  #
        try:  # 应对Windows系统 从缓存中读取空的情况
            data = conn.recv(1024)  # 收消息  从自己的缓存中找数据是最大的值
            if not data:
                continue  # 应对Linux系统从缓存中读取空的情况
            res = subprocess.Popen(
                data.decode("utf-8"), shell=True, stdout=subprocess.PIPE,
                stderr=subprocess.PIPE)   # 把读取的信息存放在管道中            
            '''
            # 这是判断错误的方式
            err = res.stderr.read()  # 首先判断错误信息
            if not err:   # 这是读取到的正常信息
                res_cmd = res.stdout.read()
            else:
                res_cmd = err      # 这是读取道的错误信息
            conn.send(res_cmd)   # 最后把接收到的数据发送到客户端
            '''
            # 这是直接发送的数据
            res_err = res.stderr.read()
            res_out = res.stdout.read()
            conn.send(res_err)
            conn.send(res_out)
        except Exception:
            break
    conn.close()   # 断开连接
phone.close()  # 关闭服务器连接

客户端

import socket

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
phone.connect(("127.0.0.1", 8888))  # 直接进行连接

while True:
    cmd = input(">>:").strip()  # 输入去除空格 换行
    if not cmd:
        continue  # 没有输入内容 继续输入
    # phone.send(cmd.encode("utf-8"))  # 
    phone.send(bytes(cmd.encode("utf-8")))  # 默认发送的是字节bytes
    data = phone.recv(1024)    # 从客户端自己的缓存中寻找
    print(data.decode('gbk'))  # win 平台的默认编码是gbk 在Linux中用uft-8
phone.close()  # 关闭客户端

实验的时候首先开启服务端,然后开启客户端

执行结果:

>>:cd 
D:Python.......

>>:listen
'listen' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

>>:ls 
'ls' 不是内部或外部命令,也不是可运行的程序
或批处理文件。

>>:tree
卷 我的小D 的文件夹 PATH 列表
卷序列号为 0005-B7F0
D:.
没有子文件夹 
>>:hello
'hello' 不是内部或外部命令,也不是可运行的程序
或批处理文件。
>>:

2.1 基于TCP制作远程执行命令操作(Linux服务端)

在Linux上需要修改IP地址位服务端的地址,客户端的解码方式修改成utf-8

服务端

# coding:utf-8
# 基于TCP制作的远程执行命令的操作
# version;版本1
# 问题:有粘包现象  具体看执行的结果

import socket
import subprocess

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# family=AF_INET, type=SOCK_STREAM, proto=0, _sock=None)   # 买手机
# phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)  # 就是它,在bind前加
phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)


phone.bind(('192.168.16.200', 8800))   #  修改成Linux自己的IP地址
phone.listen(5)  # 开机 相当于挂起的电话连接

print("starting...")

while True:   # 通信循环
    conn, addr = phone.accept()  # 等待电话连接
    while True:  #
        try:  # 应对Windows系统 从缓存中读取空的情况
            data = conn.recv(1024)  # 收消息  从自己的缓存中找数据是最大的值
            if not data:
                continue  # 应对Linux系统从缓存中读取空的情况
            res = subprocess.Popen(
                data.decode("utf-8"), shell=True, stdout=subprocess.PIPE,
                stderr=subprocess.PIPE)   # 把读取的信息存放在管道中            
            '''
            # 这是判断错误的方式
            err = res.stderr.read()  # 首先判断错误信息
            if not err:   # 这是读取到的正常信息
                res_cmd = res.stdout.read()
            else:
                res_cmd = err      # 这是读取道的错误信息
            conn.send(res_cmd)   # 最后把接收到的数据发送到客户端
            '''
            # 这是直接发送的数据
            res_err = res.stderr.read()
            res_out = res.stdout.read()
            conn.send(res_err)
            conn.send(res_out)
        except Exception:
            break
    conn.close()   # 断开连接
phone.close()  # 关闭服务器连接

客户端

# coding:utf-8

import socket

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# phone.connect(("127.0.0.1", 8888))  # 直接进行连接
phone.connect(("192.168.16.200", 8800))  # Linux测试

while True:
    cmd = input(">>:").strip()  # 输入去除空格 换行
    if not cmd:
        continue  # 没有输入内容 继续输入
    # phone.send(cmd.encode("utf-8"))  #
    phone.send(bytes(cmd.encode("utf-8")))  # 默认发送的是字节bytes
    data = phone.recv(1024)    # 从客户端自己的缓存中寻找
    # print(data.decode('gbk'))  # win 平台的默认编码是gbk 在Linux中用uft-8
    print(data.decode('utf-8'))  # win 平台的默认编码是gbk 在Linux中用uft-8
phone.close()  # 关闭客户端

执行结果

>>:pwd 
/

>>:cat /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
systemd-bus-proxy:x:999:998:systemd Bus Proxy:/:/sbin/nologin
systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
polkitd:x:998:997:User for polkitd:/:/sbin/nologin
tss:x:59:59:Account used by the trousers package to sandbox the tcsd daemon:/dev/null:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
hzx:x:1000:1000::/home/hzx:/bin/bash
help:x:1001:1001::/home/hel
>>:ls                # !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!看下面的就是粘包
p:/bin/bash
egon:x:1002:1002::/home/egon:/bin/bash
tom:x:1004:1004::/home/tom:/bin/bash
jake:x:1005:1006::/home/jake:/bin/bash
rose:x:1006:1007::/home/rose:/bin/bash
nginx:x:997:995:Nginx web server:/var/lib/nginx:/sbin/nologin
rpc:x:32:32:Rpcbind Daemon:/var/lib/rpcbind:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin

>>:ls   # 现在才是正常执行的结果
bin
boot
dev
etc
FtpServer
hello.py
home
lib
lib64
media
mnt
opt
proc
Python-3.6.0
Python-3.6.0.tgz
root
run
sbin
sdb1
sdb2
sdb3
server.py
share
srv
sys
tail_new.py
tail.py
tartmp
test
test3
tmp
tmux
tmux-2.3
tmux-2.3.tar.gz
usr
var
>>:

2.2 粘包产生的原因:

上面出现了粘包的问题,粘包产生的主要原因是TCP协议是面向流(socket.SOCK_STREAM)),意思就是说发送端可以一个字节一个字节的发送, 软件的速度是大于网络的速度(网络有延迟),TCP把数据量小,时间间隔小的进行封包,一块发送,这就无法区分包的边界

接收端从自己的缓存中是有多少取多少,发送过来的是字节是没有边界的,所以收的时候是通过修改recv(1024)中的参数来增加一次性接收的值,但是这个如果是一个大文件的时候是有问题的,会全部去取到内存中,内存会爆。

所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的。

3 解决粘包

类似以太网协议,在数据的前面加上固定长度的报头,报头中包含字节流的长度,然后一次send到对端。

对端在接收时,先从自己的缓存中取出定长的报头,然后再获取真实的数据

 1 解决粘包的最终版Linux服务端
 2 
 3 
 4 import socket
 5 import subprocess
 6 import json
 7 import struct
 8 
 9 phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
10 phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
11 # phone.bind(('127.0.0.1', 8120))
12 phone.bind(('192.168.16.200', 8220))
13 
14 phone.listen(5)
15 
16 print("sever is starting...")
17 while True:  # 通信循环
18     conn, addr = phone.accept()
19     print(conn)
20     print(addr)
21     while True:
22         try:
23             data = conn.recv(1024)  # conn.recv
24             if not data:
25                 continue
26             res = subprocess.Popen(data.decode("utf-8"),
27                                    shell=True,
28                                    stdout=subprocess.PIPE,
29                                    stderr=subprocess.PIPE)
30 
31             res_err = res.stderr.read()
32             res_out = res.stdout.read()
33 
34             # 数据长度
35             data_size = len(res_err) + len(res_out)
36 
37             # 制作报头
38             head_dic = {"data_size": data_size}  # 把报头制作成字典格式
39             head_json = json.dumps(head_dic)  # json 序列化
40             head_bytes = head_json.encode("utf-8")  # 要发送需要转换成字节数据
41 
42             # 1 发送报头的长度
43             head_len = len(head_bytes)  # 这是报头的长度
44             conn.send(struct.pack("i", head_len))
45 
46             # 2 发送报头
47             conn.send(head_bytes)
48 
49             # 3 发送真实的数据
50             conn.send(res_err)
51             conn.send(res_out)
52 
53         except Exception:
54             break
55     conn.close()
56 phone.close()


客户端

import socket
import json
import struct

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# phone.connect(("192.168.16.200", 8120))
phone.connect(("192.168.43.20", 8220))

while True:
cmd = input(">>:").strip()
if not cmd:
continue
# phone.send(cmd.encode("utf-8"))
phone.send(bytes(cmd,encoding="utf-8"))

# 1 接收报头长度
head_struct = phone.recv(4) # 先接收报头
head_len = struct.unpack("i", head_struct)[0]

# 2 接收报头

head_bytes = phone.recv(head_len)
head_json = head_bytes.decode("utf-8")
head_dic = json.loads(head_json)
print(head_dic)
data_size = head_dic["data_size"]

# 接收数据
recv_size = 0
recv_data = b''
while recv_size < data_size:
data = phone.recv(1024)
recv_size += len(data)
recv_data += data
print(recv_data.decode("utf-8"))

phone.close()

解决粘包的最终版Linux服务端
```python
#
import socket
import subprocess
import json
import struct

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
phone.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
# phone.bind(('127.0.0.1', 8120))
phone.bind(('192.168.16.200', 8220))

phone.listen(5)

print("sever is starting...")
while True: # 通信循环
conn, addr = phone.accept()
print(conn)
print(addr)
while True:
try:
data = conn.recv(1024) # conn.recv
if not data:
continue
res = subprocess.Popen(data.decode("utf-8"),
shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE)

res_err = res.stderr.read()
res_out = res.stdout.read()

# 数据长度
data_size = len(res_err) + len(res_out)

# 制作报头
head_dic = {"data_size": data_size} # 把报头制作成字典格式
head_json = json.dumps(head_dic) # json 序列化
head_bytes = head_json.encode("utf-8") # 要发送需要转换成字节数据

# 1 发送报头的长度
head_len = len(head_bytes) # 这是报头的长度
conn.send(struct.pack("i", head_len))

# 2 发送报头
conn.send(head_bytes)

# 3 发送真实的数据
conn.send(res_err)
conn.send(res_out)

except Exception:
break
conn.close()
phone.close()

```


客户端
```python
#
import socket
import json
import struct

phone = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# phone.connect(("192.168.16.200", 8120))
phone.connect(("192.168.43.20", 8220))

while True:
cmd = input(">>:").strip()
if not cmd:
continue
# phone.send(cmd.encode("utf-8"))
phone.send(bytes(cmd,encoding="utf-8"))

# 1 接收报头长度
head_struct = phone.recv(4) # 先接收报头
head_len = struct.unpack("i", head_struct)[0]

# 2 接收报头

head_bytes = phone.recv(head_len)
head_json = head_bytes.decode("utf-8")
head_dic = json.loads(head_json)
print(head_dic)
data_size = head_dic["data_size"]

# 接收数据
recv_size = 0
recv_data = b''
while recv_size < data_size:
data = phone.recv(1024)
recv_size += len(data)
recv_data += data
print(recv_data.decode("utf-8"))

phone.close()

```

原文地址:https://www.cnblogs.com/Python666/p/6811146.html