网络编程基础之网络协议篇

一 CS架构和与BS架构

  Client(客服端 )<===========>Server(服务端)

  客户端软件send         服务端软件recv
  操作系统             操作系统
  计算机硬件<====物理介质=====>计算机硬件

二 网络通信原理

  2.1什么是网络

    网络存在的意义就是跨地域数据传输==>称之为通信

    网络=物理链接介质(网线,交换器......)+互联网通信协议

  2.2 什么是互联网通信协议

    互联网的本质就是一系列的网络协议

    一台硬设有了操作系统,然后装上软件你就可以正常使用了,然而你也只能自己使用,像这样,每个人都拥有一台自己的机器,然而彼此孤立

1

    如何能大家一起玩耍

2

    然而internet为何物?其实两台计算机之间通信与两个人打电话之间通信的原理是一样的(中国有很多地区,不同的地区有不同的方言,为了全中国人都可以听懂,大家统一讲普通话)3

    普通话属于中国国内人与人之间通信的标准,那如果是两个国家的人交流呢?

4

    问题是,你不可能要求一个人/计算机掌握全世界的语言/标准,于是有了世界统一的通信标准:英语

5

    结论:英语成为世界上所有人通信的统一标准,如果把计算机看成分布于世界各地的人,那么连接两台计算机之间的internet实际上就是

    一系列统一的标准,这些标准称之为互联网协议,互联网的本质就是一系列的协议,总称为‘互联网协议’(Internet Protocol Suite).

    互联网协议的功能:定义计算机如何接入internet,以及接入internet的计算机通信的标准。

 三 osi七层协议

  3.1 七层协议分类

    互联网协议按照功能不同分为osi七层或tcp/ip五层或tcp/ip四层

协议

    协议:规定数据的组织格式。格式:头部+数据部分。举个例子把东西(数据)邮寄给某人需要先把东西(数据)打包,在外面要写上收件人寄件人等(头部),然后在邮寄到收件人手上,收件人需要

    拆掉包裹(头部),就能得到里面的东西(数据)。

协议

  3.2 5层协议的介绍

    3.2.1 物理层

物理层

      物理层主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0

      一组物理层数据称之为:位

      单纯的电信号毫无意义,必须对其进行分组,这就涉及到数据链路层

    3.2.2 数据链路层

      数据链路层由来:单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思

      数据链路层的功能:定义了电信号的分组方式

      ethernet以太网协议规定

        规定1:一组数据称之为一个数据帧

        规定2:数据帧分成两部分==>头+数据

          头包含(固定18个字节):发送这/源地址(6字节)与接收者/目标地址(6字节)和数据类型(6个字节)     该地址是mac地址

          数据包含(最短46字节,最长1500字节):网络层发过来的整体的内容

          head长度+data长度=最短64字节,最长1518字节,超过最大限制就分片发送

        规定3:规定但凡接入互联网的主机必须有一块网卡,每块网卡在出厂时都烧制好一个全世界独一无二的地址,该地址称之为mac地址

      mac地址

        head中包含的源和目标地址由来:ethernet规定接入internet的设备都必须具备网卡,发送端和接收端的地址便是指网卡的地址,即mac地址

        长度为48位2进制,通常由12位16进制数表示(前六位是厂商编号,后六位是流水线号)

      广播

        注意:计算机通信基本靠吼,即以太网协议的工作方式是广播

广播

    3.2.3 网络层

      网络层由来:有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了。

      问题是世界范围的互联网是由一个个彼此隔离的小的局域网组成的,那么如果所有的通信都采用以太网的广播方式,那么一台机器发送的包全世界都会收到。

      网络层

      上图就得出了网络层的功能:划分广播域,每一个广播域但凡要接通外部,一定要有一个网关帮内部的计算机转发包到公网,网关与外界通信走的是路由协议

      网络层同样有几个规定:

        规定1:一组数据称之为一个数据包

        规定2:数据帧分成两部分==>头+数据

          头包含:源地址与目标地址,该地址是IP地址

          数据包含的:传输层发过来的整体的内容

      IP协议:

        规定网络地址的协议叫ip协议,它定义的地址称之为ip地址,广泛采用的v4版本即ipv4,它规定网络地址由32位2进制表示

        范围0.0.0.0-255.255.255.255

        一个ip地址通常写成四段十进制数,例:172.16.10.1

        ip地址分为两部分一个合法的ipv4地址组成部分=ip地址/子网掩码地址

        注意:单纯的ip地址段只是标识了ip地址的种类,从网络部分或主机部分都无法辨识一个ip所处的子网

      子网掩码:

        所谓”子网掩码”,就是表示子网络特征的一个参数。它在形式上等同于IP地址,也是一个32位二进制数字,它的网络部分全部为1,主机部分全部为0。

        比如,IP地址172.16.10.1,如果已知网络部分是前24位,主机部分是后8位,那么子网络掩码就是11111111.11111111.11111111.00000000,

        写成十进制就是255.255.255.0。

        知道”子网掩码”,我们就能判断,任意两个IP地址是否处在同一个子网络。

        方法是将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),然后比较结果是否相同,如果是的话,就表明它们在同一个子网络中,否则就不是。

#先装换为2进制,然后按位比较都为1才是1
计算机1:
172.16.10.1:     10101100.00010000.00001010.000000001
255255.255.255.0: 11111111.11111111.11111111.000000000
172.16.10.0:      10101100.00010000.00001010.000000000

计算机2:
172.16.10.2:      10101100.00010000.00001010.000000010
255.255.255.255.0: 11111111.11111111.11111111.000000000
172.16.10.0:       10101100.00010000.00001010.000000000
案例

        总结一下,IP协议的作用主要有两个,一个是为每一台计算机分配IP地址,另一个是确定哪些地址在同一个子网络。

       ARP协议

        arp协议由来:计算机通信基本靠吼,即广播的方式,所有上层的包到最后都要封装上以太网头,然后通过以太网协议发送,在谈及以太网协议时候,我门了解到

        通信是基于mac的广播方式实现,计算机在发包时,获取自身的mac是容易的,如何获取目标主机的mac,就需要通过arp协议

        arp协议功能:广播的方式发送数据包,获取目标主机的mac地址

        协议工作方式:每台主机ip都是已知的

        例如:主机172.16.10.10/24访问172.16.10.11/24

        一:首先通过ip地址和子网掩码区分出自己所处的子网

场景 数据包地址
同一子网 目标主机mac,目标主机ip
不同子网 网关mac,目标主机ip

        二:分析172.16.10.10/24与172.16.10.11/24处于同一网络(如果不是同一网络,那么下表中目标ip为172.16.10.1,通过arp获取的是网关的mac)

  源mac 目标mac 源ip 目标ip 数据部分
发送端主机 发送端mac FF:FF:FF:FF:FF:FF 172.16.10.10/24 172.16.10.11/24 数据

        三:这个包会以广播的方式在发送端所处的自网内传输,所有主机接收后拆开包,发现目标ip为自己的,就响应,返回自己的mac

    3.2.4 传输层 

      传输层的由来:网络层的ip帮我们区分子网,以太网层的mac帮我们找到主机,然后大家使用的都是应用程序,你的电脑上可能同时开启qq,暴风影音,等多个应用程序,

      那么我们通过ip和mac找到了一台特定的主机,如何标识这台主机上的应用程序,答案就是端口,端口即应用程序与网卡关联的编号。

      传输层功能:建立端口到端口的通信。ip+port=>标识全世界范围内独一无二的一个基于网络通信的应用程序

      补充:端口范围0-65535,0-1023为系统占用端口

      tcp协议:

      可靠传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。

      可靠在于它允许网络间两台主机之间无差错来的信息传输,只有等接收端得到数据并回复,然后发送端得到回复的时候才会把发送的数据删除。

      优点:可靠    缺点:效率低

以太网头 ip 头      tcp头       数据       

      udp协议:

      不可靠传输,”报头”部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。

      不可靠在于发送端不关心发送的数据是否到达目标主机,数据是否出错等。收到数据的主机也不会告诉发送方是否收到了数据。

      优点:效率高   缺点:不可靠

以太网头 ip头     udp头   数据

      

      tcp报文

      报文

            

      基于tcp协议通信之前:必须建立一个双向通信的链接

      C-------------------->S

      C<--------------------S

      1

      TCP握手详解(建立连接协议三次握手):

      1.第一次握手:客户端发送一段TCP报文到服务端,随后进入客户端进入SYN_SEND状态,等待服务器的确认

               标记位是SYN:表示想建立链接

               序号为seq= x

      2.第二次握手:服务端接收到来自客户端的TCP报文之后,结束LISTEN阶段。并返回一段TCP报文,随后服务端进入SYN_RCVD状态

               标记位是SYN和ACK:表示“确认客户端的报文Seq序号有效,服务器能正常接收客户端发送的数据,并同意创建新连接”(即告诉客户端,服务器收到了你的数据)

               序号为Seq=y

               确认号为Ack=x+1,表示收到客户端的序号Seq并将其值加1作为自己确认号Ack的值

      3.第三次握手:客服端收到来自服务端的TCP报文之后,明确了从客户端到服务器的数据传输是正常的,进入ESTABLISHED阶段。并返回最后一段TCP报文。

               确认号为Ack=y+1,表示收到服务端的序号Seq并将其值加1作为自己确认号Ack的值

             服务器收到来自客户端的“确认收到服务器数据”的TCP报文之后,明确了从服务器到客户端的数据传输是正常的。结束SYN-SENT阶段,进入ESTABLISHED阶段。

      握手过程中不会传送数据,三次握手完毕后,客户端与服务器才正式开始传送数据。理想状态下,TCP链接一旦建立,在通信双方中的任何一方主动关闭链接前,TCP链接都会持续。

      ,

      四次挥手断开链接

      断开链接时,由于链接内有数据传输,所以必须分四次断开

      连接的释放必须是一方主动释放,另一方被动释放

      1.第一次挥手:首先客户端想要释放连接,向服务器端发送一段TCP报文,随后客户端进入FIN-WAIT-1阶段,即半关闭阶段。停止在客户端到服务器端方向上发送数据,

             但是客户端仍然能接收从服务器端传输过来的数据。

               标记位为FIN,表示“请求释放连接“;

               序号为Seq=x+2;确认号为ACK=y+1

      2.第二次挥手:服务器端接收到从客户端发出的TCP报文之后,确认了客户端想要释放连接,进入CLOSE-WAIT阶段(半关闭状态)并返回一段TCP报文

               标记位为ACK,表示“接收到客户端发送的释放连接的请求”;

               客户端收到从服务器端发出的TCP报文之后,确认了服务器收到了客户端发出的释放连接请求,进入FIN-WAIT-2阶段

      3.第三次挥手:服务器端自从发出ACK确认报文之后,做好了释放服务器端到客户端方向上的连接准备,再次向客户端发出一段TCP报文,进入LAST_ACK阶段

               并且停止在服务器端到客户端的方向上发送数据,但是服务器端仍然能够接收从客户端传输过来的数据

               标记位是FIN,表示“已经准备好释放连接了”  序号为seq=y+1

      4.第四次挥手:客户端收到从服务器端发出的TCP报文,确认了服务器端已做好释放连接的准备,进入TIME-WAIT阶段,并向服务器端发送一段报文

                标记位为ACK=y+2,这时链接才都断开

        

      

      tcp协议的半连接池:

 

        backlog:[链接请求1,链接请求2,链接请求3,链接请求5]

 

    3.2.5 应用层

      应用层由来:用户使用的都是应用程序,均工作于应用层,互联网是开发的,大家都可以开发自己的应用程序,数据多种多样,必须规定好数据的组织形式 

      应用层功能:规定应用程序的数据格式。

      可以自定义协议=>头部+数据部分

          自定义协议需要注意的问题:
        1、两大组成部分=头部+数据部分
            头部:放对数据的描述信息
                比如:数据要发给谁,数据的类型,数据的长度
            数据部分:想要发的数据
        2、头部的长度必须固定
            因为接收端要通过头部获取所接接收数据的详细信息

    3.2.6 socket

      我们知道两个进程如果需要进行通讯最基本的一个前提能能够唯一的标示一个进程,在本地进程通讯中我们可以使用PID来唯一标示一个进程,但PID只在本地唯一,

      网络中的两个进程PID冲突几率很大,这时候我们需要另辟它径了,我们知道IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,

      这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。

      能够唯一标示网络中的进程后,它们就可以利用socket进行通信了,什么是socket呢?我们经常把socket翻译为套接字,socket是在应用层和传输层之间的一个抽象层,

      它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。

1

      socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,服务器和客户端各自维护一个"文件",在建立连接打开后,

      可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。

    2.3.7 小结

1

      https://www.cnblogs.com/linhaifeng/articles/5937962.html#_label13扫盲性质的去了解

原文地址:https://www.cnblogs.com/bk134/p/12714016.html