day30 OSI七层协议

网络编程

什么是网络编程？

网络编程就是编写基于网络传输数据的应用程序

为什么需要网络编程？

在我们以前的编程中，所有的数据都是存在于本地，且只能由我们自己使用，不能进行跨电脑通讯，但是在实际的生活中，我们使用的应用程序都需要与其它计算机进行通讯，这时候我们就需要编写基于网络传输数据的应用程序

C/S架构与B/S架构

学习网络编程就是想使多台计算机之间进行数据的传输，那么这就需要至少两台计算机进行连接，一台计算机存放着共享的数据，另一台计算机可以进行访问。

C/S架构

所谓的C/S架构就是指client(客户端)/server(服务器端)架构，例如微博，我们在手机上安装有客户端软件(client)，在新浪的机房中放有服务器，其服务器上安装有服务端软件(server)，这就是C/S架构

B/S架构

所谓的B/S架构就是指browse(浏览器)/server(服务端)架构，例如微博，我们在使用电脑浏览器进行访问时，本机上的浏览器就是B(browser)端，在新浪的服务器上的软件就是S(server)端，这就是B/S架构，实际上C/S架构也是一种B/S架构，只不过客户端变成了浏览器

网络通讯的基本要素

要实现网络通讯，必须具备两个基本要素：

网络传输的介质
网络传输协议

网络传输介质

要实现网络之间的通信，最基本的要素是需要将计算机进行连接，这种连接是物理层面的，一般的连接介质有网线、无线电波等

网络传输协议

什么是协议？

协议就是标准，当我们进行通讯时，如果每个人一套标准，那么我们之间进行通讯将无从谈起，为了可以使不同的计算机之间进行通讯，那么就需要所有的人执行同一套标准，这个标准就称之为协议

都有哪些协议？

在进行通讯时，需要遵循的协议主要有两类：

物理传输介质之间的协议
网络传输的协议

物理传输介质之间的协议是网络工程需要了解的事情，作为程序员，我们需要学习的协议主要是网络传输的协议

网络通讯协议

协议是由发送方和接受方共同制定的,考虑到计算机已经发展了这么多年,所以制定的协议过程很显然我们没有机会参与了,要做的是了解通讯协议中的各种规定

OSI七层模型

什么是OSI七层模型

Open System Interconnection Reference Model，开放式系统互联通信参考模型,缩写为OSI,是由国际标准组织推出的,其实就是一大堆协议,OSI把整个通讯过程划分为七层,简称OSI七层模型

OSI七层模型由于学习成本较高，为了降低学习难度，后面简化成了五层模型，后又进一步简化成四层模型

为什么要遵循OSI协议？

OSI七层协议是由国际标准组织推出的，目的就是为了使所有厂商的电脑之间可以通讯，所有的厂商都遵循这个协议，根据七层协议可以找到并连接到世界上任意一台电脑，当然，也可以不遵循这个协议，如果不遵循这个协议是不能与其它计算机进行通讯的

OSI协议各层工作原理解析

物理层

物理层的作用是通过物理传播介质将电脑进行连接，将信息转化为二进制数据进行传输

数据链路层

将二进制数据进行传输时，如果不对数据进行分组，那么数据将没有任何意义，为了将数据进行分组，此时加入以太网协议，以太网协议通过对数据进行分组，来表达不同的意义

以太网协议:

以太网协议(Ethernet)工作在数据链路层,其规定了电信号分组方式,以及一组电信号应该包含哪些内容

ethernet规定如下:

一组电信号构成一个数据包，叫做‘帧’
每一数据帧分成：报头head和数据data两部分

head包含：(固定18个字节)

发送者／源地址，6个字节
接收者／目标地址，6个字节
数据类型(标签+以太类型)，6个字节

data包含：(最短46字节，最长1500字节)

数据包的具体内容

head长度＋data长度＝最短64字节，最长1518字节，超过最大限制就分片发送

mac地址:

head中包含的源和目标地址指的是什么地址呢?

ethernet规定接入internet的设备都必须具备网卡，发送端和接收端的地址便是指网卡的地址，即mac地址

mac地址：每块网卡出厂时都被烧制上一个世界唯一的mac地址，长度为48位2进制，通常由12位16进制数表示（前六位是厂商编号，后六位是流水线号）

广播

有了mac地址，同一网络内的两台主机就可以通信了

ethernet采用最原始的方式，广播的方式进行通信，即计算机通信基本靠吼

交换机的工作原理类似类似于早期的电话交换机,电话线打到总台,总台问你要找几号?,然后将电话线插到相应的口上

网络层

为什么需要网络层

既然根据mac地址就可以找到世界上唯一一台电脑，那为什么还需要网络层呢？

因为以太网协议的通信方式是广播，但是不能没进行一次通信就进行一次全世界广播，这时候就需要将全世界的网络分为无数个小的局域网，网络层的目的就是在全世界找到需要查找的局域网，再根据局域网中的广播找到唯一的一台计算机。

IP协议

IP协议是工作在网络层的协议,全称:Internet Protocol Address,翻译为互联网协议地址

IP地址(重点)

ip协议定义的地址称之为ip地址，广泛采用的v4版本即ipv4，它规定网络地址由32位2进制表示
范围0.0.0.0-255.255.255.255
一个ip地址通常写成四段十进制数，例：192.168.10.1
网络号：标识子网
主机号：标识主机

IP地址的分类:

A类保留给政府机构

1.0.0.0---126.0.0.0

B类分配给中等规模公司

128.0.0.0---191.255.0.0

C类分配给任何需要的人

192.168.0.1 - 192.168.255.254

D类用于组播

E类用于实验

我们的电脑ip通常都是C类的,以192.168开头,正因为C类任何人都可以用

子网掩码(了解)

什么是子网掩码

子网掩码是一个32位地址，用于屏蔽IP地址的一部分以区别网络标识和主机标识，并说明该IP地址是在局域网上，还是在远程网上。

它的网络部分全部为1，主机部分全部为0。比如，IP地址172.16.10.1，如果已知网络部分是前24位，主机部分是后8位，那么子网络掩码就是11111111.11111111.11111111.00000000，写成十进制就是255.255.255.0。

为什么需要子网掩码

单纯的ip地址段只是标识了ip地址的种类，无法辨识一个ip所处的子网例：192.168.10.1与192.168.10.2并不能确定二者处于同一子网,因为不清楚哪些位表示网络号,哪些表示主机号

子网掩码如何判断两个ip是否属于同一个子网

知道”子网掩码”，我们就能判断，任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算（两个数位都为1，运算结果为1，否则为0），然后比较结果是否相同，如果是的话，就表明它们在同一个子网络中，否则就不是。

案例: 已知IP地址172.16.10.1和172.16.10.2的子网掩码都是255.255.255.0，请问它们是否在同一个子网络？两者与子网掩码分别进行AND运算，
    
172.16.10.1：10101100.00010000.00001010.000000001
255255.255.255.0:11111111.11111111.11111111.00000000
AND运算得网络地址结果：10101100.00010000.00001010.000000001->172.16.10.0

172.16.10.2：10101100.00010000.00001010.000000010
255255.255.255.0:11111111.11111111.11111111.00000000
AND运算得网络地址结果：10101100.00010000.00001010.000000001->172.16.10.0
结果都是172.16.10.0，因此它们在同一个子网络。

总结一下，IP协议的作用主要有两个，一个是为每一台计算机分配IP地址，另一个是确定哪些地址在同一个子网络。

IP数据包(了解)

ip数据包也分为head和data部分，无须为ip包定义单独的栏位，直接放入以太网包的data部分

head：长度为20到60字节

data：最长为65,515字节。

而以太网数据包的”数据”部分，最长只有1500字节。因此，如果IP数据包超过了1500字节，它就需要分割成几个以太网数据帧，分开发送了。

ARP协议(了解)

ARP协议的由来:IP是通常是动态分配的,是一个逻辑地址,而数据传输则必须依赖MAC地址,那如何才能通过IP得到对方的MAC地址呢? 这就需要ARP协议了

arp协议功能：广播的方式发送数据包，获取目标主机的mac地址

首先明确每台主机ip都是已知的,并可以通过子网掩码来判断是否属于同一子网

案例1：主机192.168.1.101访问192.168.1.102

是同一子网内 ARP请求帧内容:

1.FF:FF:FF:FF:FF:FF是一个特殊的MAC地址交换机在看到这个地址时会将这个数据向网内所有主机进行广播

2.192.168.1.102 收到ARP请求后回复自己的MAC给源MAC主机

3.发送方(192.168.1.101)收到回复后,会将对方的ip的MAC地址映射关系存储到缓存中,以便下次使用

ps:arp -a 可以查看ARP缓存列表

确定对方MAC地址后的数据帧内容:

案例2：主机192.168.1.101访问192.168.111.101

交换机发现目标IP不在当前子网中,

1.交换机发起ARP请求,将目标IP设置为对方的网关IP,默认情况下,网关的主机号都为1; 所以接收方(192.168.111.101)的网关为192.168.111.1

发送方交换机发起的ARP数据帧:

2.对方网关收到请求后发现ip是自己的ip则回复ARP请求,将其MAC地址告知发送方交换机,

3.发送方交换机将,对方的网关与的MAC地址与IP存储到自己的ARP缓存中,

4.告知发送方(192.168.1.101)对方网关的MAC地址,发送方同样将对方网关MAC与目标IP映射关系存储到,本机ARP缓存中

至此ARP请求结束可以开始传输数据

后续确定了MAC地址后发送的数据帧内容:

总结:ARP通过广播的方式来获取MAC地址, 不在同一子网时 ARP得到的时对方网关的MAC地址,数据到达对方网关后,由网关根据IP交给对应的主机,当然对方网关获取主机MAC也是通过ARP

ps:路由器交换机都可以称之为网关!

传输层(重点)

传输层的由来:

通过物理层简历链接通道

通过数据链路层的MAC,可以定位到某个局域网中的某台主机,

通过网络层的IP地址,子网掩码,可以定位到全球范围某一局域网下的某台主机

那么问题来了:

一台计算机上是不可能只运行一个应用程序的,比如同时登陆qq和微信,那接收到的数据到底是交给微信还是qq呢?

答案就是:端口号,端口是需要联网的应用程序与网卡关联的编号

传输层功能：建立端口到端口的通信

补充：端口范围0-65535，0-1023为系统占用端口

TCP与UDP是工作在传输层的协议:

TCP协议

可靠传输，TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。

TCP之所以可靠,是因为在传输数据前需要三次握手确认建立链接

三次握手:

三次握手的过程实际上实在确认我发的你能收到,你发的我也能收到,从而保证数据传输的的可靠性,

链接是一个虚拟的概念,不实际存在,只要三次握手成功即表示连接建立成功!

问题是三次握手时的确能保障数据传输是可靠的,那么握手后的数据要如何保证传输成功呢?

TCP协议要求在发送数据后,必须接收到对方的回复信息才能确认数据成功发送,如果一段时内没有收到回复信息,会自动重新发送,如果重试的次数过多则表示链接可能已经中断!

四次挥手:

四次挥手的目的是保证双方的数据传输已经全部完成,同样是为了保证数据的完整性

总结

其优点很明显:能够保证数据传输是完整的

缺点:由于每次都需要传输确认信息,导致传输效率降低

场景:多用于必须保证数据完整性的场景,例如文本信息,支付信息等!

UDP协议

不可靠传输，”报头”部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。

UDP协议采取的方式与TCP完全不同,其根本不关心,对方是否收到数据,甚至不关心,对方的地址是否有效,只要将数据报发送到网络,便什么都不管了!

总结

优点:由于不需要传输确认信息,所以传输效率高于TCP协议

缺点:传输数据可能不完整

场景:视频聊天,语音聊天等,不要求数据完整性,但是对传输速度要求较高

应用层

应用层由来：用户使用的都是应用程序，均工作于应用层，互联网是开放的，大家都可以开发自己的应用程序，用什么样的数据格式来传输，就需要由应用程序开发者自己来制定

应用层功能：规定应用程序的数据格式。

例：TCP协议可以为各种各样的程序传递数据，比如Email、WWW、FTP等等。那么，必须有不同协议规定电子邮件、网页、FTP数据的格式，这些应用程序协议就构成了”应用层”。

至此一连串高低电压就通过层层协议,变成了我们在应用程序中看到的各种数据