Python的网络编程[0] -> socket[0] -> socket 与 TCP / UDP

Socket


socket 简述 / socket Abstract


网络进程通信与 socket

网络中进程之间如何通信,首要解决的问题是如何唯一标识一个进程,否则通信无从谈起。在本地可以通过进程 PID 来唯一标识一个进程,但是在网络中这是行不通的。其实 TCP/IP 协议族已经帮我们解决了这个问题,网络层的“ ip 地址可以唯一标识网络中的主机,而传输层的协议+端口可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip 地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。

使用 TCP/IP 协议的应用程序通常采用应用编程接口: UNIX BSD(Berkeley Software Distribution) 伯克利软件套件的套接字(socket)和 UNIX System V 的 TLI(已经被淘汰),来实现网络进程之间的通信。就目前而言,几乎所有的应用程序都是采用 socket。

socket 保证了不同计算机之间的通信,也就是网络通信。主要通信模型是客户端服务器之间的通信。两个端都建立一个 socket 对象,然后通过 socket 对象对数据进行传输。通常服务器处于一个无限循环,等待客户端连接。

网络字节序与主机字节序

网络字节序4 个字节的 32 bit值以下面的次序传输,首先是 07 bit,其次 815 bit,然后 1623 bit,最后是 24~31 bit。这种传输次序称作大端字节序。由于 TCP/IP首 部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有顺序的问题了。

主机字节序: 就是我们平常说的大端和小端模式,不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的 Big-Endian和Little-Endian 的定义如下,

a) Little-Endian 低位字节排放在内存的低地址端高位字节排放在内存的高地址端

b) Big-Endian 就是高位字节排放在内存的低地址端低位字节排放在内存的高地址端

所以,在将一个地址绑定到 socket 的时候,请先将主机字节序转换成为网络字节序,而不要假定主机字节序跟网络字节序一样使用的是 Big-Endian

TCP/IP 通信协议 / TCP/IP Communication Protocol


socket TCP/IP 通信流程

TCP(Transmission Control Protocol 传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,由 IETF 的 RFC 793 定义。

利用 socket 进行 TCP/IP 通信主要流程可以由下图表示。

TCP/IP三次握手连接

三次握手流程:

在 TCP/IP 协议中,TCP 协议为了提供可靠的连接服务,需要进行一个三次握手的确认,才能建立起传输数据的连接。

(1)第一次握手: 建立连接时,客户端 A 发送 SYN 包(SYN=j到服务器B,并进入 SYN_SEND 状态,等待服务器 B 确认。 

(2)第二次握手: 服务器 B 收到 SYN 包,必须确认客户 A 的 SYN(ACK=j+1),同时自己也发送一个 SYN 包(SYN=k),即 SYN+ACK 包,此时服务器 B 进入 SYN_RECV 状态。

(3)第三次握手: 客户端 A 收到服务器 B 的 SYN+ACK 包,向服务器 B 发送确认包ACK(ACK=k+1),此包发送完毕,客户端A和服务器B进入ESTABLISHED状态,完成三次握手。 完成三次握手,客户端与服务器开始传送数据。

Note: SYN 同步序列编号(Synchronize Sequence Numbers)

socket 中的实现:

由于 socket 对 TCP/IP 的封装,上述的三次握手实现被抽象为 socket 的几个函数,三次握手在 socket 的实现过程如下图:

  1. 当客户端调用 connect 函数时,触发了连接请求,向服务器发送了 SYN J ,这时 connect 进入阻塞状态;
  2. 服务器监听到连接请求,即收到 SYN J 包,调用 accept 函数接收请求向客户端发送 SYN K , ACK J+1,这时 accept 进入阻塞状态;
  3. 客户端收到服务器的 SYN K , ACK J+1 之后,这时 connect 返回,并对SYN K进行确认;
  4. 服务器收到ACK K+1时,accept返回,至此三次握手完毕,连接建立。

总结:客户端的 connect 在三次握手的第二次返回,而服务器端的 accept 在三次握手的第三次返回。

TCP/IP四次握手释放

上面介绍了 socket 中 TCP 的三次握手建立过程,下面介绍 socket 中的四次握手释放连接的过程,如下图:

  1. 某个应用进程首先调用 close 主动关闭连接,这时 TCP 发送一个 FIN M;
  2. 另一端接收到 FIN M 之后,执行被动关闭,对这个 FIN 进行确认,返回 ACK M+1 。它的接收也作为文件结束符传递给应用进程,因为 FIN 的接收意味着应用进程在相应的连接上再也接收不到额外数据;
  3. 一段时间之后,接收到文件结束符的应用进程调用 close 关闭它的 socket。这导致它的 TCP 也发送一个 FIN N;
  4. 接收到这个 FIN 的源发送端 TCP 对它进行确认,返回 ACK N+1。这样每个方向上都有一个 FIN ACK
  5. 至此,连接的建立已断开。

UDP/IP 通信协议 / UDP/IP Communication Protocol


UDP 是 User Datagram Protocol 的简称,中文名是用户数据报协议,是 OSI(Open System Interconnection,开放式系统互联)参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务,IETF RFC 768 是 UDP 的正式规范。UDP 在 IP 报文的协议号是17。

 

TCP/UDP 协议对比 / TCP/UDP Communication Protocol Comparison


这部分可以参考这里这里

TCP/UDP 的区别

TCP 与 UDP 主要区别包括以下几点:

1.基于连接与无连接;

2.对系统资源的要求(TCP 较多,UDP 少);

3.UDP程序结构较简单;

4.流模式与数据报模式;

5.TCP 保证数据正确性,UDP 可能丢包,TCP 保证数据顺序,UDP 不保证。

TCP -- 传输控制协议,提供的是面向连接、可靠的字节流服务。当客户和服务器彼此交换数据前,必须先在双方之间建立一个 TCP 连接,之后才能传输数据。TCP 提供超时重发,丢弃重复数据,检验数据,流量控制等功能,保证数据能从一端传到另一端。

UDP -- 用户数据报协议,是一个简单的面向数据报的运输层协议。UDP不提供可靠性,它只是把应用程序传给 IP 层的数据报发送出去,但是并不能保证它们能到达目的地。由于UDP在传输数据报前不用在客户和服务器之间建立一个连接,且没有超时重发等机制,故而传输速度很快

UDP 与 TCP 的主要区别在于 UDP 不一定提供可靠的数据传输。事实上,该协议不能保证数据准确无误地到达目的地。UDP 在许多方面非常有效。当某个程序的目标是尽快地传输尽可能多的信息时(其中任意给定数据的重要性相对较低),可使用 UDP。ICQ 短消息使用 UDP 协议发送消息。

许多程序将使用单独的 TCP 连接和单独的 UDP 连接。重要的状态信息随可靠的 TCP 连接发送,而主数据流通过 UDP 发送。

 TCP 的目的是提供可靠的数据传输,并在相互进行通信的设备或服务之间保持一个虚拟连接。TCP 在数据包接收无序、丢失或在交付期间被破坏时,负责数据恢复。它通过为其发送的每个数据包提供一个序号来完成此恢复。记住,较低的网络层会将每个数据包视为一个独立的单元,因此,数据包可以沿完全不同的路径发送,即使它们都是同一消息的组成部分。这种路由与网络层处理分段和重新组装数据包的方式非常相似,只是级别更高而已。

为确保正确地接收数据,TCP 要求在目标计算机成功收到数据时发回一个确认(即 ACK)。如果在某个时限内未收到相应的 ACK,将重新传送数据包。如果网络拥塞,这种重新传送将导致发送的数据包重复。但是,接收计算机可使用数据包的序号来确定它是否为重复数据包,并在必要时丢弃它。

TCP/UDP 的选择

如果比较 UDP 包和 TCP 包的结构,很明显 UDP 包不具备 TCP 包复杂的可靠性与控制机制。与 TCP 协议相同,UDP 的源端口数和目的端口数也都支持一台主机上的多个应用。一个 16 位的 UDP 包包含了一个字节长的头部和数据的长度,校验码域使其可以进行整体校验。(许多应用只支持 UDP,如:多媒体数据流,不产生任何额外的数据,即使知道有破坏的包也不进行重发。)

很明显,当数据传输的性能必须让位于数据传输的完整性、可控制性和可靠性时,TCP 协议是当然的选择。当强调传输性能而不是传输的完整性时,如:音频和多媒体应用,UDP 是最好的选择。在数据传输时间很短,以至于此前的连接过程成为整个流量主体的情况下,UDP 也是一个好的选择,如:DNS 交换。把  SNMP 建立在 UDP 上的部分原因是设计者认为当发生网络阻塞时,UDP 较低的开销使其有更好的机会去传送管理数据。TCP 丰富的功能有时会导致不可预料的性能低下,但是我们相信在不远的将来,TCP 可靠的点对点连接将会用于绝大多数的网络应用。

TCP/UDP/IP协议分析 / TCP/UDP/IP Communication Protocol Analysis


这部分可以参考这里

参考链接


http://blog.csdn.net/jiajia4336/article/details/8798421

http://blog.csdn.net/legend050709/article/details/39804519

http://blog.csdn.net/a199228/article/details/7020884

https://jingyan.baidu.com/article/6dad5075df3452a123e36ecb.html

http://blog.chinaunix.net/uid-26833883-id-3627644.html

原文地址:https://www.cnblogs.com/stacklike/p/8117738.html