《HTTP权威指南》1-HTTP概要

Http

HyperText Transfer Protocol,超文本协议
通过此协议,我们可以将遍布全世界的Web服务器上的信息块快速,便捷,可靠的搬移到我们自己桌面上的Web浏览器上。
这些信息块指的是什么呢?
我们平时看到的图片,电影,音频,文本,Html页面都包含在其中。

Web客户端和服务器

客户端和服务器

资源

Web服务器是Web资源的宿主

媒体类型

因特网上有数千种不同的数据类型,当Web浏览器从服务器取回一个对象时,需要知道其类型,以便知道如何处理这个对象。

于是Http为每种要通过Web传输的对象打上了数据格式标签,名为MIME(Multipurpose Internet Mail Extemsion)类型,MIME是一种文本标记,表示一种主要的对象类型和一个特定的子类型,中间由一条斜杠来分割。如:

  • Html格式的文本文档的MIME为text/html

  • JPEG图片的MIME为image/jpeg

URI

每个Web服务器资源都有一个名字,服务器资源名称被称为统一资源标识符(Uniform Resource Indentifier,URI),URI有两种形式,分别是URL和URN。

URL

统一资源定位符(URL)

URL解析

  • URL的第一部分被称为方案(scheme),说明了访问资源所使用的协议类型。

  • 第二部分给出了服务器的因特网地址

  • 其余部分指定了Web服务器上的某个资源

URN

统一资源名(URN)

URN是作为特定内容的唯一名称使用的,与目前的资源所在地无关

事务

一个HTTP事务由一条请求命令(客户端发往服务器)和一个响应结果(服务器发回客户端)组成。

通信是通过名为HTTP报文的格式化数据块进行

报文

方法

HTTP支持几种不同的请求命令,这些命令被称为HTTP方法,每条请求报文都包含一个方法,方法会告诉服务器要执行什么动作

  • GET

  • PUT

  • DELETE

  • POST

  • HEAD

状态码

每条HTTP响应报文返回时,会携带一个状态码,状态码是一个三位数字的代码,告诉客户端是否请求成功,或者是否需要采取其他动作,如200,302,404

报文

HTTP报文分为请求报文和响应报文

包含以下三个部分:

  • 起始行,报文的第一行就是起始行,在请求报文中用来说明要做些什么,在响应报文中说明出现了什么情况

  • 首部字段,起始行后有零个或多个首部字段,每个首部字段都包含一个名字和一个值,两者用:分割,以一个空行结束

  • 主体,其中包含了所有类型的数据,请求主体中包含了要发送给Web服务器的数据,响应主体中装载了要返回给客户端的数据

报文

连接

知道了报文的存在后,我们再来看一下它是如何从一个地方搬移到另一个地方去的。
HTTP是应用层协议,它不需要关心网络通信的具体细节,而是将联网的细节交给了通用,可靠的因特网传输协议TCP/IP

TCP/IP

TCP提供了:

  • 无差错的数据传输
  • 按序传输
  • 未分段的数据流

只要建立了TCP连接,客户端和服务器之间的报文交换就不会消失,不会被破坏,也不会在接收时出现错序了。

连接,IP地址及端口号

在HTTP客户端向服务器发送报文之前,需要问网际协议(Internet Protocol,IP)地址和端口号在客户端和服务器之间建立一条TCP/IP连接。
那么浏览器是怎么通过浏览器显示位于远端服务器中的某个HTML资源的呢?

  1. 浏览器从URL中解析出服务器的主机名
  2. 浏览器将服务器的主机名转换为服务器的IP地址
  3. 浏览器将端口号从URL中解析出来(如果有的话)
  4. 浏览器建立一条与Web服务器的TCP连接;
  5. 浏览器向服务器发送一条HTTP请求报文
  6. 服务器向浏览器回送一条HTTP响应报文
  7. 关闭连接,浏览器显示文档

基本的浏览器连接处理

Web的结构组件

Web应用程序:

代理

代理是位于客户端和服务器之间的HTTP中间实体,是Web安全,应用集成以及性能优化的重要组成模块,其接受所有客户端的HTTP请求,然后将这些请求转发给服务器
代理

缓存

Web缓存或代理缓存是一种特殊的HTTP代理服务器,可以将经过代理传送的常用文档复制保存起来,下一个请求同一文档的客户端就可以享受缓存的私有副本所提供的服务了

网关(gateway)

网关是一种特殊的服务器,作为其他服务器的中间实体使用,通常用于将HTTP流量转换成其他的协议

隧道

隧道(tunnel),是在连接建立起来后,在两条连接之间对原始数据进行盲转发的HTTP应用程序,通常用来在一条或多条HTTP连接上转发非HTTP数据,转发时不会窥探数据。

Agent代理

Agent代理是代表用户发起HTTP请求的客户端程序。所有发布Web请求的应用程序都是Agent代理

原文地址:https://www.cnblogs.com/quxikun/p/8425441.html