http请求全过程

第一步:浏览器生成http请求信息(第五层)

  1.分解url

    当用户输入网址时,浏览器会以一定的规则分解网址,

    以 http://www.cemabenteng.com/dir/index.html 为例进行分解,

    http为请求的协议名称,www.cemabenteng.com为请求的web服务器,dir/index.html为请求的资源,

    (如果是静态资源,则dir为该服务器上的目录,index.html为该目录上的资源,如果是动态资源,则服务器会根据请求的资源名称动态提供资源)

   2.生成http请求消息

    消息格式:    <方法  URI  http版本>

             <消息头>

             <消息体> 

    2.1 方法

       当用户输入网址,或者点击超链接请求服务器时,使用的是GET方法

       当提交form表单时,使用form页面设置的方法

    2.2 URI 

       即上例中的dir/index.html

    2.3 http版本

      一般为1.1

    2.4 消息头

      与请求相关的一些信息,例如我们熟知的cookie,User-Agent(使用的浏览器类型及版本)等。

    2.5 消息体

      消息体存放请求中携带的数据,因为GET方法所携带的数据都在URL中,因此消息体没有内容。而POST方法所携带的数据就存放于此。

  3.域名解析

    生成消息后,浏览器会调用操作系统的DNS客户端向DNS服务器查询域名对应的IP地址。

      3.1 浏览器将域名(即上例中的www.cemabenteng.com)发送给DNS服务器,

      3.2 DNS客户器将域名生成域名查询消息并发送给tcpip协议驱动,

      3.3 tcpip协议驱动使用网卡将消息发送给最近的DNS服务器,

      3.4 最近的DNS服务器将消息发送给根服务器,然后逐级向下查询,直到查询到结果返回。

        ps:DNS查询使用UDP协议,只发送一个包,而由于包大小有限,只能容下13个根服务器信息,因此世界上只有13个根服务器,国内只有根服务器镜像。

  4.委托操作系统发送http请求

    浏览器将IP地址和请求消息发送给操作系统,委托操作系统发送出http请求。

第二步:TCP模块发送请求(第四层)

    1.创建套接字

      操作系统在接到请求后,首先会申请一块用于存放一个套接字所需的内存空间,套接字是存放了一些通信相关的控制信息的集合。

      然后向这个内存空间写入一些初始状态,并把该套接字的唯一标识告诉应用程序,即浏览器。

    2.连接服务器

       连接服务器就是通信双方交换控制信息。操作系统首先接受浏览器给出的服务器地址,然后申请数据缓存空间并创建TCP头部,通过

      委托ip模块,向服务器传达开始通信的请求。服务器会返回连接成功的信息,之后会向套接字中写入服务器的ip等信息,并标识状态为已连接。

      最后客户端返回接收相应成功的信息给服务器,连接就算成功完成了。当没有收到确认信息时,会重新发送,多次失败后才会向外报错。

      (这就像一个快递公司,有很复杂的机制)

    3.发送数据

      操作系统收到数据后会将数据存放在的发送数据缓存区中,并等待接收后续数据,只有当接收的数据达到一个网络包的大小的时候,或者达到最大等待时间之后,

      才会委托ip模块发送出去。浏览器数据量小、对性能要求高,一般会设置为直接发送。一般的http请求数据用一个网络包就够了,但有时提交的表单数据较大时,会拆分成

      多个网络包发送。

第三步:IP模块发送请求(第三层)

    1.生成IP头部

      IP模块在发送数据前,会生成IP头部,再附上要发送的数据。IP头部包含IP地址等信息。

    2.生成MAC头部

      生成IP头部后,还会在前面加上MAC头部。它包含了MAC地址等信息。MAC地址需使用IP通过ARP协议查询。每次转发过程都会更换下一个网络设备的MAC地址。

第四步:MAC模块发送请求(第二层)

    1.生成报头

      mac模块会在网络包的开头加上报头和起始帧分界符。报头是一串固定频率的时钟信号,它用于确定数据每一位的读取时机。

      报头后面是起始帧分界符,它的末尾序列比起报头有一点变化,用来标记报头的结束,网络包的开始。

    2.生成校验序列

      除了开头的报头,末尾还会加上帧校验序列,校验序列是通过整个包计算出来的,用于校验包的正误。类似身份证的校验码。

    3.生成电信号

      帧组装完毕后,便会转换成通用的电信号并委托PHY模块发送。

第五步:PHY模块发送请求(第一层)

    最终网卡中的PHY模块会将通用电信号转换成网络传输所需的格式,通过网线发送出去。经过网络转发后,最终到达服务器。

    。。。

    最后,服务器反向重复上述步骤,把电信号逐步转换回http请求信息并进行处理。

    ps:上述内容纯属博主个人理解,如有谬误,还望指出。

原文地址:https://www.cnblogs.com/uip001/p/6728042.html