python网络编程

一、什么是c/s架构

C指的是client(客户端软件),S指的是Server(服务端软件),服务端软件与客户端软件基于网络实现通信。

二、计算机基础

应用软件必须运行于操作系统之上,操作系统则运行于硬件之上,应用软件是无法直接操作硬件的,应用软件对硬件的操作必须调用操作系统的接口,由操作系统操控硬件。

比如客户端软件想要基于网络发送一条消息给服务端软件,流程是:

1、客户端软件产生数据,存放于客户端软件的内存中,然后调用接口将自己内存中的数据发送/拷贝给操作系统内存

2、客户端操作系统收到数据后,按照客户端软件指定的规则(即协议)、调用网卡发送数据

3、网络传输数据

4、服务端软件调用系统接口,想要将数据从操作系统内存拷贝到自己的内存中

5、服务端操作系统收到4的指令后,使用与客户端相同的规则(即协议)从网卡接收到数据,然后拷贝给服务端软件

三、什么是网络

计算机之间的通信首先要有物理链接介质,比如网线,交换机,路由器等网络设备。 通信的线路建好之后,只是物理层面有了可以承载数据的介质,要想通信,还需要我们按照某种规则组织我们的数据,这样对方在接收到数据后就可以按照相同的规则去解析出数据,即互联网协议。

网络就是物理链接介质+互联网协议。

四、互联网协议

osi七层,tcp/ip五层,tcp/ip四层

OSI/RM模型(Open System Interconnection / Reference Model)的设计目的是成为一个所有计算机厂商都能实现的开放网络模型,来克服使用众多私有网络模型所带来的困难和低效性。

五、TCP/IP协议详解

1、物理层

物理层功能:主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0

所以物理层就是一系列的数字0和1.

2、数据链路层

数据链路层由来:单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思

数据链路层的功能:定义了电信号的分组方式

以太网协议:

早期的时候各个公司都有自己的分组方式,后来形成了统一的标准,即以太网协议ethernet

ethernet规定

  • 一组电信号构成一个数据包,叫做‘帧’
  • 每一数据帧分成:报头head数据data两部分

head包含:(固定18个字节)

  • 发送者/源地址,6个字节
  • 接收者/目标地址,6个字节
  • 数据类型,6个字节

head中包含的源和目标地址是电脑的网卡上的MAC地址,通过MAC地址可以找到同一局域网内的电脑位置。

data包含:(最短46字节,最长1500字节)

  • 数据包的具体内容

head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送

有了mac地址,同一网络内的两台主机就可以通信了。

3、网络层

不同局域网的计算机如何通信呢?

网络层功能:引入一套新的地址用来区分不同的广播域/子网,这套地址即网络地址

IP协议:
  • 规定网络地址的协议叫ip协议,它定义的地址称之为ip地址,广泛采用的v4版本即ipv4,它规定网络地址由32位2进制表示
  • 范围0.0.0.0-255.255.255.255
  • 一个ip地址通常写成四段十进制数,例:172.16.10.1

子网掩码

所谓”子网掩码”,就是表示子网络特征的一个参数。它在形式上等同于IP地址,也是一个32位二进制数字,它的网络部分全部为1,主机部分全部为0。比如,IP地址172.16.10.1,如果已知网络部分是前24位,主机部分是后8位,那么子网络掩码就是11111111.11111111.11111111.00000000,写成十进制就是255.255.255.0。

子网掩码是用来标识一个IP地址的哪些位是代表网络位,以及哪些位是代表主机位。子网掩码不能单独存在,它必须结合IP地址一起使用。子网掩码只有一个作用,就是将某个IP地址划分成网络地址和主机地址两部分。

通过IP地址可以找到计算机在哪个局域网内。

IP地址分类:

IP地址根据网络ID的不同分为5种类型,A类地址、B类地址、C类地址、D类地址和E类地址。

  1. A类IP地址:一个A类IP地址由1字节的网络地址和3字节主机地址组成,网络地址的最高位必须是“0”, 地址范围从1.0.0.0 到126.0.0.0。可用的A类网络有126个,每个网络能容纳1亿多个主机。
  2. B类IP地址 :一个B类IP地址由2个字节的网络地址和2个字节的主机地址组成,网络地址的最高位必须是“10”,地址范围从128.0.0.0到191.255.255.255。可用的B类网络有16382个,每个网络能容纳6万多个主机 。
  3. C类IP地址:一个C类IP地址由3字节的网络地址和1字节的主机地址组成,网络地址的最高位必须是“110”。范围从192.0.0.0到223.255.255.255。C类网络可达209万余个,每个网络能容纳254个主机。
  4. D类地址用于多点广播(Multicast): D类IP地址第一个字节以“lll0”开始,它是一个专门保留的地址。它并不指向特定的网络,目前这一类地址被用在多点广播(Multicast)中。多点广播地址用来一次寻址一组计算机,它标识共享同一协议的一组计算机。
  5. E类IP地址 以“llll0”开始,为将来使用保留。

全零(“0.0.0.0”)地址对应于当前主机。全“1”的IP地址(“255.255.255.255”)是当前子网的广播地址。

回环地址(127.0.0.1) 又称为本机地址

ARP协议

arp协议由来:计算机通信基本靠吼,即广播的方式,所有上层的包到最后都要封装上以太网头,然后通过以太网协议发送,在谈及以太网协议时候,我门了解到

通信是基于mac的广播方式实现,计算机在发包时,获取自身的mac是容易的,如何获取目标主机的mac,就需要通过arp协议

arp协议功能:广播的方式发送数据包,获取目标主机的mac地址

协议工作方式:每台主机ip都是已知的

例如:主机172.16.10.10/24访问172.16.10.11/24

一:首先通过ip地址和子网掩码区分出自己所处的子网

二:分析172.16.10.10/24与172.16.10.11/24处于同一网络(如果不是同一网络,那么目标ip为172.16.10.1,通过arp获取的是网关的mac)

三:这个包会以广播的方式在发送端所处的子网内传输,所有主机接收后拆开包,发现目标ip为自己的,就响应,返回自己的mac

ICMP

IP协议并不是一个可靠的协议,它不保证数据被送达,那么,自然的,保证数据送达的工作应该由其他的模块来完成。其中一个重要的模块就是ICMP(网络控制报文)协议。

当传送IP数据包发生错误--比如主机不可达,路由不可达等等,ICMP协议将会把错误信息封包,然后传送回给主机。给主机一个处理错误的机会.

我们一般主要用ICMP协议检测网络是否通畅,基于ICMP协议的工具主要有ping 和traceroute

4、传输层

网络层的ip帮我们区分子网,以太网层的mac帮我们找到主机,那么我们通过ip和mac找到了一台特定的主机,如何标识这台主机上的应用程序呢?答案就是端口,端口即应用程序与网卡关联的编号。

输层功能:建立端口到端口的通信

端口范围:0-65535,0-1023为系统占用端口

传输层有两种协议:TCP和UDP

tcp协议

可靠的传输协议,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。

之所以可靠,是因为只要不得到对方收到消息的确认,就重新发送数据报,直到得到对方的确认为止。

tcp通过3次握手建立发送端与接收端的双向数据传输通道,通过4次握手结束发送端和接收端的数据传输通道。

udp协议

不可靠的传输协议,”报头”部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。

tcp与udp的区别:

tcp协议是基于连接的,基于流的,它的传输需要通过三次握手建立通道,因此是可靠的传输,但传输效率不高,网络开销大,并不是一次send就对应一次recv,发送空消息时,对方是收不到的,会有粘包现象产生;

udp协议是基于数据报的协议,它的传输不需要三次握手,因此是不可靠的传输,但传输效率高,开销低,一次sendto就对应一次recvfrom,发送空消息,对方也能收到(因为它的发送自带端口信息的),不会发生粘包,主要用于查询信息,QQ也是使用UPD协议。

5、应用层

应用层可以使用http、ftp协议,也可以自定义。

服务端必须绑定ip地址和端口号(一般不能随意更改),客户端不用捆绑,但必须有ip地址和端口号。

原文地址:https://www.cnblogs.com/yanlin-10/p/9125767.html