浏览器工作原理与实践(二)

TCP协议如何保证页面能被完整送达浏览器?

在衡量Web页面性能的时候有一个重要的指标叫“FP”,是指从页面加载到首屏绘制的时长,这个指标影响了用户的跳出率,更快的页面影响意味着更多的PV、更高的参与度以及更高的转化率。

影响FP的一个重要因素是网络加载速度。

 优化Web页面的加载速度,你需要对网络有充分的了解,而理解网络的关键是要对网络协议有深刻的认识,不管你是使用HTTP还是使用WebSocket,它们都是基于TCP/IP的,如果你对这些原理有足够的了解,也就清楚如何去优化Web性能,或者能更轻松地定位 Web 问题。

 在网络中,一个文件 通常会被拆分成很多数据包来进行传输,而数据包在传输过程中又有很大概率丢失或者出错。

 那么如何保证页面文件能被完整的送达浏览器呢?

 一个数据包的“旅程”

 下面我将分别从“数据包如何送达主机”“主句如何将数据包转交给应用”和“数据包是如何被完整的送达应用程序”三个角度来描述数据的传输过程。

 互联网,实际上是一套理念和协议组成的体系架构。其中,协议是一套众所周知的规则和标准,如果各方都同意使用,那么它们之间的通信将变得毫无障碍

 互联网中的数据都是通过数据包来传输的。如果发送的数据很大,那么该数据就会被拆分成很多小数据包来传输

 IP: 把数据包送达目的主机:

数据包要在网上进行传输,就要符合网际协议(IP) 标准。互联网上不同的在线设备都有唯一的一个地址,地址只是一个数字。计算机中的地址就成为IP地址,访问任何网站实际只是计算机向另外一台计算机请求信息。如果想要把一个数据包从主机A发送给主机B,那么在传输之前,数据包会附加上主机B的IP地址信息,这样在传输过程中才能正确寻址。额外地,数据包上还会附加上主机A本身的IP地址,有了这些信息值机B才可以回复信息给主机A,这些附加的信息会被装进一个叫IP头的数据结构里。IP头是IP数据包开头的信息,包含IP版本、源IP地址、目标IP地址,

为了方便,简单把网络分为三层,如图一

 一起看一下一个数据包从主机A到主机B的旅程,

  1. 上层将含有“极客时间”的数据包交给网络层
  2. 网络层再将 IP 头附加到数据包上,组成新的 IP 数据包,并交给底层
  3. 底层通过物理网络将数据包给主机B
  4. 数据包被传到主机B的网络层,在这里主机B拆开数据包的IP头信息,并将拆开的数据部分交给上层
  5. 最终,含有“极客时间”信息的数据包就到达了主机B的上层了

 2.UDP:把数据包送达应用程序

IP是非常底层的协议,只负责把数据包传送到对方电脑,但是对方电脑并不知道数据包交给哪个程序,是交给浏览器还是交给王者荣耀?因此,需要基于IP之上开发能和应用打交道的协议,最常见的是“用户数据包协议”,简称UDP. 

 UDP中一个最重要的信息是端口号,通过端口号UDP就能把指定的数据包发送给指定的程序了。

所以 IP 通过 IP 地址信息把数据包发送给指定的电脑,而 UDP 通过端口号把数据包分发给正确的程序。和IP头一样,端口号会被装进 UDP 头里面,UDP头再和原始数据包合并组成除了目的端口还有源端口号等信息

如图:在网络层和和上层之间增加了传输层

再看一下数据包从主机A旅行到主机B的路线:

  1. 上层将含有“极客时间”的数据包交给传输层
  2. 传输层会在数据包前面附加上 UDP 头,组成新的 UDP 数据包,再将新的 UDP 数据包交给网络层
  3. 网络层再将 IP 头附加到数据包上,组成新的 IP 数据包,并交给底层
  4. 数据包被传输到主机B的网络层,在这主机B拆开IP数据包,并将拆开的数据部分交给传输层
  5. 在传输层,数据包中的UDP头会被拆开,根据UDP提供的端口号,把数据交给上层的应用程序
  6. 最终将含有“极客时间”信息的数据包就旅行到了主机B上层应用程序这里

注:在使用UDP发送数据时,有各种因素导致数据包出错,虽然UDP可以校验数据是否正确,但是对于错误的数据包,UDP并不触发重发机制,只是丢弃当前的包,而且也无法知道是否到达目的地。 UDP不能保证数据可靠性,但是传输数据非常快 ,所以UDP会应用在一些关注速度,并不那么严格要求数据完整性的领域,如:在线视频、互动游戏等。

3.TCP:将数据完整地送达应用程序

对于浏览器请求或者邮件这类要求数据传输可靠性的应用,使用UDP会存在两个问题

  • 数据包传输过程容易丢失
  • 大文件会被拆分很多小的数据包来传输,这些小的数据包会经过不同的路由,并在不同的时间到达接收端,而UDP不知道如何组装这些数据,还原完整文件

 基于这两个问题引入了TCP

 TCP(传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议,

相对UDP,TCP有以下两个特点

  • 对于数据包的丢失情况,TCP提供重传机制;
  • TCP引入了数据包排序机制,用来保证把乱序的数据包组合成一个完整的文件

 和UDP头一样,TCP头除了包含目标端口和本机端口号外,还提供了用于排序的序列号,以便接收端通过序列号来重排数据包

通过上图可以看出TCP单个数据包的传输流程个UDP流程差不多,不同在于 TCP的头信息保证了一块大的数据传输的完整性

看一下完整的TCP 连接过程,通过这个过程你可以明白TCP是如何保证重传机制和数据包的排序功能

 从上图可以看出,一个完整的TCP连接的生命周期包括“建立连接”“传输数据”和“断开连接”三个阶段

  1. 首先,建立连接阶段。这个阶段是通过“三次握手”来建立客户端和服务端之间的连接。TCP提供面向连接的通信传输。面向连接是指在通信开始之前先做好两端之间的准备工作。所谓三次握手,是指一个建立TCP连接时,客户端和服务器总共要发送三个数据包以确认连接的建立
  2. 其次,传输数据阶段,在该阶段,接收端需要对每个数据包进行确认操作,也就是接收端在接受到数据包之后需要发送确认数据包给发送端。所以当发送端发送了一个数据包之后,在规定时间内没有接收到接收端反馈的确认消息,则判断数据包丢失,并触发发送端的重发机制。同样,一个大的文件在传输过程中会被拆分成很多小的数据包,这些数据包到达接收端后,接收端会按照TCP头中的序号为其排序,从而保证完整的数据
  3. 最后,断开连接阶段。数据传输完毕后就要终止连接,这几最后一个阶段“四次挥手”来保证双方都能断开连接

 TCP为了保证数据传输的准确性,牺牲了传输速度

在 PDFlux 中打开
无数据
原文地址:https://www.cnblogs.com/cuixiaohua/p/12762621.html