Python全栈开发【Socket网络编程】

Python全栈【socket网络编程】

本章内容:

  1. Socket
  2. 基于TCP的套接字
  3. 基于UDP的套接字
  4. TCP粘包
  5. SocketServer 模块(ThreadingTCPServer源码剖析)

Socket

1、socket通常也称作"套接字"

用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。

socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)

socket和file的区别:

  • file模块是针对某个指定文件进行【打开】【读写】【关闭】
  • socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】

为何学习socket一定要先学习互联网协议:

1.首先:本节课程的目标就是教会你如何基于socket编程,来开发一款自己的C/S架构软件

2.其次:C/S架构的软件(软件属于应用层)是基于网络进行通信的

3.然后:网络的核心即一堆协议,协议即标准,你想开发一款基于网络通信的软件,就必须遵循这些标准。

 

2、socket层

 

Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。

 

所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的。

 

 

3、套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。 

1)基于文件类型的套接字家族

套接字家族的名字:AF_UNIX

unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信

2)基于网络类型的套接字家族

套接字家族的名字:AF_INET

(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)

4、套接字工作流程

服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。

★TCP套接字工作流程(牢记)

复习三次握手与四次挥手 

socket类

sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)
参数一:地址簇
 
  socket.AF_INET IPv4(默认)
  socket.AF_INET6 IPv6
 
  socket.AF_UNIX 只能够用于单一的Unix系统进程间通信
 
参数二:类型
 
  socket.SOCK_STREAM  流式socket , for TCP (默认)
  socket.SOCK_DGRAM   数据报式socket , for UDP
 
参数三:协议
 
  0  (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议
 
 
 
sk.bind(address)
 
  s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。
 
sk.listen(backlog)
 
  开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。
 
      backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
      这个值不能无限大,因为要在内核中维护连接队列
 
sk.setblocking(bool)
 
  是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。
 
sk.accept()
 
  接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
 
  接收TCP 客户的连接(阻塞式)等待连接的到来
 
sk.connect(address)
 
  连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
 
sk.connect_ex(address)
 
  同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061
 
sk.close()
 
  关闭套接字
 
sk.recv(bufsize[,flag])
 
  接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。
 
sk.recvfrom(bufsize[.flag])
 
  与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
 
sk.send(string[,flag])
 
  将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。
 
sk.sendall(string[,flag])
 
  将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
 
      内部通过递归调用send,将所有内容发送出去。
 
sk.sendto(string[,flag],address)
 
  将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。
 
sk.settimeout(timeout)
 
  设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )
 
sk.getpeername()
 
  返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
 
sk.getsockname()
 
  返回套接字自己的地址。通常是一个元组(ipaddr,port)
 
sk.fileno()
 
  套接字的文件描述符
基于TCP的套接字

举例学习:模拟FTP文件上传及断点续传

 1 #tcp_server.py
 2 from socket import *
 3 
 4 ip_port = ('127.0.0.1',8000)
 5 buffer_size = 1024
 6 back_log = 5
 7 
 8 server = socket(AF_INET,SOCK_STREAM)
 9 server.bind(ip_port)
10 server.listen(back_log)
11 
12 conn,addr = server.accept()
13 
14 f_size = int(str(conn.recv(buffer_size).decode('utf-8')))
15 conn.send(bytes(str(f_size).encode('utf-8')))
16 recv_size=0
17 with open('2.txt', 'wb') as f:
18     while True:
19         if recv_size ==f_size:
20             break
21         else:
22             recv_msg = conn.recv(buffer_size)
23             f.write(recv_msg)
24             recv_size += len(recv_msg)
 1 #tcp_client.py
 2 from socket import *
 3 import os
 4 ip_port = ('127.0.0.1',8000)
 5 buffer_size = 1024
 6 back_log = 5
 7 
 8 client = socket(AF_INET,SOCK_STREAM)
 9 client.connect(ip_port)
10 
11 file_size=os.stat('1.txt').st_size
12 client.send(str(file_size).encode('utf-8')) #先发送文件大小,解决粘包问题
13 msg = client.recv(buffer_size)
14 
15 have_rec = 0
16 if int(str(msg.decode('utf-8'))) ==file_size:
17     with open('1.txt', 'rb') as f:
18         for line in f:
19             client.send(line)
20             have_rec+=len(line)
21             print('模拟断点出现')
22             break  # 模拟出现断点的情况再续传
23     with open('1.txt', 'rb') as f:
24         f.seek(have_rec) # 文件指针指到已经上传完成的部分
25         for line in f:
26             client.send(line)

有时重启服务端时会出现:

解决方法:

#加入一条socket配置,重用ip和端口

ss=socket(AF_INET,SOCK_STREAM)
ss.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) #在bind前加setsockopt
ss.bind(('127.0.0.1',8000))
基于UDP的套接字

 服务端

 1 from socket import *
 2 import time
 3 ip_port=('127.0.0.1',9000)
 4 BUFSIZE=1024
 5 udp_server=socket(AF_INET,SOCK_DGRAM)  #面向信息
 6 #UDP无连接,所以可以同时多个客户端去跟服务端通信
 7 udp_server.bind(ip_port) #需要绑定地址与端口号
 8 
 9 while True:
10     msg,addr=udp_server.recvfrom(BUFSIZE)
11     print(msg.decode('utf-8'),addr)   #hello ('127.0.0.1', 49448)
12     if not msg:
13         fmt ='%Y-%m-%d %X'
14     else:
15         fmt ='%Y:%m:%d %X'
16     back_time = time.strftime(fmt)
17     udp_server.sendto(back_time.encode('utf-8'),addr) #发送信息时需要后面带目的地址信息

客户端

 1 from socket import *
 2 ip_port=('127.0.0.1',9000)
 3 BUFSIZE=1024
 4 udp_client=socket(AF_INET,SOCK_DGRAM)
 5 
 6 while True:
 7     msg=input('>>: ').strip()
 8     if not msg:continue
 9 
10     udp_client.sendto(msg.encode('utf-8'),ip_port) #发送带服务端地址信息
11 
12     back_msg,addr=udp_client.recvfrom(BUFSIZE)
13     print(back_msg.decode('utf-8'))   #2017:01:03 09:24:48

UDP模拟Win下cmd命令(会丢包)

from socket import *
import subprocess
ip_port = ('127.0.0.1',8000)
back_log = 5
buffer_size = 1024

udp_server = socket(AF_INET,SOCK_DGRAM)
udp_server.bind(ip_port)

while True:
    cmd,addr = udp_server.recvfrom(buffer_size)
    print('新的客户端链接',addr)

    print('收到客户的命令是',cmd.decode('utf-8'))
    res = subprocess.Popen(cmd.decode('utf-8'),shell=True,
                           stderr = subprocess.PIPE,
                           stdout = subprocess.PIPE,
                           stdin = subprocess.PIPE)
    err = res.stderr.read()
    if err:
        cmd_res =err
    else:
        cmd_res = res.stdout.read()
    udp_server.sendto(cmd_res,addr)
server
from socket import *

ip_port = ('127.0.0.1',8000)
back_log = 5
buffer_size = 1024

udp_client = socket(AF_INET,SOCK_DGRAM)

while True:
    cmd =input('>>>').strip()
    if not cmd:continue
    if cmd =='quit':break

    udp_client.sendto(cmd.encode('utf-8'),ip_port)
    cmd_res,addr = udp_client.recvfrom(buffer_size)
    print('命令执行的结果是',cmd_res.decode('gbk'))
udp_client.close()
client

TCP粘包

 

原文地址:https://www.cnblogs.com/mocean/p/6243759.html