图解HTTP

了解Web及网络基础

为了理解HTTP,我们有必要事先了解一下TCP/IP 协议族。通常使用的网络(包括互联网)是在TCP/IP 协议族的基础上运作的。而HTTP 属于它内部的一个子集。

计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标,由哪一边先发起通信,使用哪种语言进行通信,怎么结束通信等规则都需要实现确定。

不同的硬件、操作系统之间的通信,需要一种规则,称之为  协议 。

把与互联网相关联的协议集合起来总称为 TCP/IP。也有说法认为,TCP/IP 是指TCP 和IP 这两种协议。还有一种说法认为,TCP/IP 是在IP 协议的通信过程中,使用到的协议族的统称。

TCP/IP 协议族里重要的一点就是分层。TCP/IP 协议族按层次分别分为以下4 层:应用层、传输层、网络层和数据链路层

好处:分层知乎,要替换部分,不需要动整体。只要把变动的层替换掉就好。把各层之间的接口部分规划好以后,每个层次内部的设计就能自由改动。层次化之后,设计也相对简单了。

处于应用层上的应用可以只考虑分配给自己的任务,不需要弄清对方。


各层作用

  • 应用层

决定了向用户提供应用服务时通信的活动。

TCP/IP协议族内预存了各类通信的应用服务,比如,FTP (文件传输协议)和 DNS(域名系统)就是其中两类。

HTTP 协议也在应用层

 

  • 传输层

传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。

在传输层有两个性质不同的协议:TCP (传输控制协议)和 UDP(用户数据报协议)

 

  • 网络层(又叫网络互连层)

用来处理网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。

与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起到的作用就是在众多的选项中选择一条传输路线。

 

  • 链路层(又叫 数据链路层,网络接口层)

用来处理连接网络的硬件部分。包括控制操作系统,硬件的设备驱动,NIC(网络适配器,即网卡),和光纤等物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在链路层

的作用范围之内。

利用TCP/IP协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。

讲一个完整的过程。用 HTTP 举例。首先作为发送端的客户端在应用层(HTTP协议)发憷一个想看某个 Web 页面的 HTTP 请求。

接着,为了传输方便,在传输层(TCP协议)把应用层出收到的数据(HTTP请求报文)进行分割,并在各个报文上打上标记序号及端口号后转发给网络层。

在网络层(IP协议),增加作为通信目的地的MAC地址后转发给链路层。这样一来,发往网络的通信请求就准备好了。

接收端的服务器在链路层接收到数据,按序往上层发送,一直到应用层。当传输到应用层,才能算真正接收到由客户端发送过来的 HTTP 请求。

发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。

这种把数据信息包装起来的做法叫做  封装 。

 

下面讲 IP 、TCP、DNS 这三个协议是怎么回事。

  • IP

按照层次分,IP网际协议位于网络层。IP协议的作用是把各种数据包传送给对方。而要保证确实传送到对方那里, 需要满足各类条件。其中两个最重要的条件是:IP地址、MAC 地址

IP地址指明了节点被分配到的地址,MAC 地址是指网卡所需的固定地址。IP 地址可以和 MAC 地址进行配对。IP 地址可以变换, 但 MAC 地址基本上不会更改。

# 使用ARP 协议凭借MAC 地址进行通信

IP 间的通信依赖 MAC 地址。网络上,通信的双方在同一局域网(LAN)内很少见。通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 

MAC 地址来搜索下一个中转目标。这时,会采用 ARP 协议。ARP 协议是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。

在到达通信目标前的中转过程中,那些计算机和路由器等网络设备只能获悉粗略的传输路线。这种机制叫 路由选择。

 

  • TCP

TCP位于传输层,提供可靠的字节流服务。

具体是说,为了方便传输,将大块数据分割成报文段为单位的数据包进行管理。而可靠的传输服务时指能够把数据准确可靠地传给对方。

TCP 协议为了更容易的传送大数据才把数据分割,而且 TCP 协议能够确认数据最终是否送达到对方。

# 三次握手

为了准确无误地将数据送达到目标处,TCP 协议采用了三次握手策略。用 TCP 协议把数据包送出去之后,TCP 不会对传送后的情况置之不理,它一定会向对方确认是否成功送达.

握手过程中使用了 TCP 的标志 (flag)——SYN 和 ACK

发送端首先发送一个带 SYN 标志的数据包给对方。接收端收到后,回传给一个带有 SYN/ACK 标志的数据包以示传达确认信息。最后,发送端再回传一个带 ACK 标志的数据包,代表 “握手”

结束。

若在握手过程中某个阶段莫名终端, TCP 协议会再次以相同的顺序发送相同的数据包。除了上述三次握手,TCP 协议还有其他各种手段来保证通信的可靠性。

  • DNS

提供域名到 IP 地址之间的解析服务。

计算机可以被赋予 IP 地址,也可以被赋予主机名和域名。

用户通常使用主机名和域名访问对方的计算机,而不是直接通过 IP 地址 访问。因为与 IP 地址的一组纯数字相比,用字母配合数字的表示形式来指定计算机名更符合人类记忆。

DNS 协议通过域名查找 IP地址,或逆向从 IP 地址反查域名的服务。

  • URI 和 URL

URI(统一资源标识符)URL(统一资源定位符)

URI 就是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称。

采用HTTP协议时,协议方案就是 http。除此之外,还有 ftp、mailto、telnet、file等。

URI 用字符串标识某一互联网资源,而URL 表示资源的地点(互联网上所处的位置)。因此,URL 是 URI 的子集。

URI 格式:

让我们先来了解一下绝对URI 的格式。

使用http: 或https: 等协议方案名获取访问资源时要指定协议类型。
不区分字母大小写,最后附一个冒号(:)。也可使用data: 或javascript: 这类指定数据或脚本程序的方案名。

# 登录信息(认证)

指定用户名和密码作为从服务器端获取资源时必要的登录信息(身份认证)。此项是可选项。

# 服务器地址

使用绝对URI 必须指定待访问的服务器地址。地址可以是类似hackr.jp 这种DNS 可解析的名称,或是192.168.1.1 这类IPv4 地址名,还可以是[0:0:0:0:0:0:0:1] 这样用方括号括起来的IPv6 地址名。

# 服务器端口号

  指定服务器连接的网络端口号。此项也是可选项,若用户省略则自动使用默认端口号。

# 带层次的文件路径

  指定服务器上的文件路径来定位特指的资源。这与UNIX 系统的文件目录结构相似。

# 查询字符串

  针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数。此项可选。

原文地址:https://www.cnblogs.com/boxin/p/9776004.html