python网络编程

一、什么是c/s架构

C指的是client（客户端软件），S指的是Server（服务端软件），服务端软件与客户端软件基于网络实现通信。

二、计算机基础

应用软件必须运行于操作系统之上，操作系统则运行于硬件之上，应用软件是无法直接操作硬件的，应用软件对硬件的操作必须调用操作系统的接口，由操作系统操控硬件。

比如客户端软件想要基于网络发送一条消息给服务端软件，流程是：

1、客户端软件产生数据，存放于客户端软件的内存中，然后调用接口将自己内存中的数据发送／拷贝给操作系统内存

2、客户端操作系统收到数据后，按照客户端软件指定的规则（即协议）、调用网卡发送数据

3、网络传输数据

4、服务端软件调用系统接口，想要将数据从操作系统内存拷贝到自己的内存中

5、服务端操作系统收到4的指令后，使用与客户端相同的规则（即协议）从网卡接收到数据，然后拷贝给服务端软件

三、什么是网络

计算机之间的通信首先要有物理链接介质，比如网线，交换机，路由器等网络设备。通信的线路建好之后，只是物理层面有了可以承载数据的介质，要想通信，还需要我们按照某种规则组织我们的数据，这样对方在接收到数据后就可以按照相同的规则去解析出数据，即互联网协议。

网络就是物理链接介质+互联网协议。

四、互联网协议

osi七层，tcp/ip五层，tcp/ip四层

OSI/RM模型(Open System Interconnection / Reference Model)的设计目的是成为一个所有计算机厂商都能实现的开放网络模型，来克服使用众多私有网络模型所带来的困难和低效性。

五、TCP/IP协议详解

1、物理层

物理层功能：主要是基于电器特性发送高低电压(电信号)，高电压对应数字1，低电压对应数字0

所以物理层就是一系列的数字0和1.

2、数据链路层

数据链路层由来：单纯的电信号0和1没有任何意义，必须规定电信号多少位一组，每组什么意思

数据链路层的功能：定义了电信号的分组方式

以太网协议：

早期的时候各个公司都有自己的分组方式，后来形成了统一的标准，即以太网协议ethernet

ethernet规定

一组电信号构成一个数据包，叫做‘帧’
每一数据帧分成：报头head和数据data两部分

head包含：(固定18个字节)

发送者／源地址，6个字节
接收者／目标地址，6个字节
数据类型，6个字节

head中包含的源和目标地址是电脑的网卡上的MAC地址，通过MAC地址可以找到同一局域网内的电脑位置。

data包含：(最短46字节，最长1500字节)

数据包的具体内容

head长度＋data长度＝最短64字节，最长1518字节，超过最大限制就分片发送

有了mac地址，同一网络内的两台主机就可以通信了。

3、网络层

不同局域网的计算机如何通信呢?

网络层功能：引入一套新的地址用来区分不同的广播域／子网，这套地址即网络地址

IP协议：

规定网络地址的协议叫ip协议，它定义的地址称之为ip地址，广泛采用的v4版本即ipv4，它规定网络地址由32位2进制表示
范围0.0.0.0-255.255.255.255
一个ip地址通常写成四段十进制数，例：172.16.10.1

子网掩码

所谓”子网掩码”，就是表示子网络特征的一个参数。它在形式上等同于IP地址，也是一个32位二进制数字，它的网络部分全部为1，主机部分全部为0。比如，IP地址172.16.10.1，如果已知网络部分是前24位，主机部分是后8位，那么子网络掩码就是11111111.11111111.11111111.00000000，写成十进制就是255.255.255.0。

子网掩码是用来标识一个IP地址的哪些位是代表网络位，以及哪些位是代表主机位。子网掩码不能单独存在，它必须结合IP地址一起使用。子网掩码只有一个作用，就是将某个IP地址划分成网络地址和主机地址两部分。

通过IP地址可以找到计算机在哪个局域网内。

IP地址分类：

IP地址根据网络ID的不同分为5种类型，A类地址、B类地址、C类地址、D类地址和E类地址。

A类IP地址：一个A类IP地址由1字节的网络地址和3字节主机地址组成，网络地址的最高位必须是“0”，地址范围从1.0.0.0 到126.0.0.0。可用的A类网络有126个，每个网络能容纳1亿多个主机。
B类IP地址：一个B类IP地址由2个字节的网络地址和2个字节的主机地址组成，网络地址的最高位必须是“10”，地址范围从128.0.0.0到191.255.255.255。可用的B类网络有16382个，每个网络能容纳6万多个主机。
C类IP地址：一个C类IP地址由3字节的网络地址和1字节的主机地址组成，网络地址的最高位必须是“110”。范围从192.0.0.0到223.255.255.255。C类网络可达209万余个，每个网络能容纳254个主机。
D类地址用于多点广播（Multicast）： D类IP地址第一个字节以“lll0”开始，它是一个专门保留的地址。它并不指向特定的网络，目前这一类地址被用在多点广播（Multicast）中。多点广播地址用来一次寻址一组计算机，它标识共享同一协议的一组计算机。
E类IP地址以“llll0”开始，为将来使用保留。

全零（“0．0．0．0”）地址对应于当前主机。全“1”的IP地址（“255．255．255．255”）是当前子网的广播地址。

回环地址(127.0.0.1) 又称为本机地址

ARP协议

arp协议由来：计算机通信基本靠吼，即广播的方式，所有上层的包到最后都要封装上以太网头，然后通过以太网协议发送，在谈及以太网协议时候，我门了解到

通信是基于mac的广播方式实现，计算机在发包时，获取自身的mac是容易的，如何获取目标主机的mac，就需要通过arp协议

arp协议功能：广播的方式发送数据包，获取目标主机的mac地址

协议工作方式：每台主机ip都是已知的

例如：主机172.16.10.10/24访问172.16.10.11/24

一：首先通过ip地址和子网掩码区分出自己所处的子网

二：分析172.16.10.10/24与172.16.10.11/24处于同一网络(如果不是同一网络，那么目标ip为172.16.10.1,通过arp获取的是网关的mac)

三：这个包会以广播的方式在发送端所处的子网内传输，所有主机接收后拆开包，发现目标ip为自己的，就响应，返回自己的mac

ICMP

IP协议并不是一个可靠的协议，它不保证数据被送达，那么，自然的，保证数据送达的工作应该由其他的模块来完成。其中一个重要的模块就是ICMP(网络控制报文)协议。

当传送IP数据包发生错误－－比如主机不可达，路由不可达等等，ICMP协议将会把错误信息封包，然后传送回给主机。给主机一个处理错误的机会.

我们一般主要用ICMP协议检测网络是否通畅，基于ICMP协议的工具主要有ping 和traceroute

4、传输层

网络层的ip帮我们区分子网，以太网层的mac帮我们找到主机，那么我们通过ip和mac找到了一台特定的主机，如何标识这台主机上的应用程序呢？答案就是端口，端口即应用程序与网卡关联的编号。

输层功能：建立端口到端口的通信

端口范围：0-65535，0-1023为系统占用端口

传输层有两种协议：TCP和UDP

tcp协议

可靠的传输协议，TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。

之所以可靠，是因为只要不得到对方收到消息的确认，就重新发送数据报，直到得到对方的确认为止。

tcp通过3次握手建立发送端与接收端的双向数据传输通道，通过4次握手结束发送端和接收端的数据传输通道。

udp协议

不可靠的传输协议，”报头”部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。

tcp与udp的区别：

tcp协议是基于连接的，基于流的，它的传输需要通过三次握手建立通道，因此是可靠的传输，但传输效率不高，网络开销大，并不是一次send就对应一次recv，发送空消息时，对方是收不到的，会有粘包现象产生；

udp协议是基于数据报的协议，它的传输不需要三次握手，因此是不可靠的传输，但传输效率高，开销低，一次sendto就对应一次recvfrom，发送空消息，对方也能收到（因为它的发送自带端口信息的），不会发生粘包，主要用于查询信息，QQ也是使用UPD协议。

5、应用层

应用层可以使用http、ftp协议，也可以自定义。

服务端必须绑定ip地址和端口号（一般不能随意更改），客户端不用捆绑，但必须有ip地址和端口号。