HTTP笔记整理（2）

四、 http协议之请求

1、http请求由三部分组成，分别是：请求行（request line）、请求报头（request header）、请求正文（body）

（1）、请求行：用来说明请求类型、要访问的资源以及使用的http版本

（2）、请求报头：用来说明服务器要使用的附加信息

（3）、正文：和header之间要有一个空行，可添加任意的其他数据

2、常用的请求报头：

Accept：用于指定客户端接受哪些类型的信息，如：image/gif，表明客户端希望接受GIF图像格式的资源；

Accept-charset：用于指定客户端接受的字符集，如：Accept-charset:iso-8859-1,gb2312。

注：如果请求信息中没有设置这个，则缺省是默认任何字符集都可接受。

Accept-encoding：类似于Accept，用于指定可接受的内容编码。如果请求信息中没有设置这个，则缺省是默认任何字符集都可接受。

Accept-language：指定一种自然语言

Authorization：用于证明客户端有权查看某个资源。当浏览器访问一个页面时，如果收到服务器的响应代码为401（未授权），可以发送一个包含Authorization请求报头域的请求，要求服务器对其进行验证。

User-Agent：允许客户端将其操作系统、浏览器和其他属性告诉服务器。（不是必需的）

五、 http协议之响应

1、 http响应也由三部分组成，分别是：状态行（request line）、响应报头（request header）、响应正文（body）

header与body之间有空行。

Method表示请求方法（“post“或”get“），path-to-resource表示请求的资源，Http/version-number表示HTTP协议的版本号。

注意：当使用“GET”方法的时候，body（请求数据）为空！如下图所示：

状态代码有三位数字组成，第一个数字定义了响应的类别，有5种可取值：

1xx：指示信息，表示请求已接收，继续处理；

2xx：成功，表示请求已被成功接收、理解、接受；

3xx：重定向，要完成请求必须进行更进一步的操作；

4xx：客户端错误，请求有语法错误或请求无法实现；

5xx：服务器端错误，服务器未能实现合法的请求。

2、常见状态码、状态描述、说明

200：OK //客户端请求成功

400：Bad Request //客户端请求有语法错误，不能被服务器所理解

401：Unauthorized //请求未经授权，这个状态码必须和www-Authenticate报头域一起使用

403：forbidden //服务器收到请求，但是拒绝提供服务

404：not found //请求资源不存在

500：Internal Server Error //服务器发生不可预期的错误

503：Server Unavailable //服务器当前不能处理客户端的请求，一段时间后可能恢复正常。

3、常见的响应报头

Server：指定服务器名称，包含了处理请求的服务器使用的软件产品信息。与User-Agent请求报头域是相对应的；

Location：重定向请求者到一个新的URL地址。常用在更换域名的时候；

Allow：指出服务器所支持的请求方式，如GET、POST等方法；

Content-Encoding：指定文档的编码方法；

Content-Length：指定响应中数据的字节长度；

Date：指定发送http消息的日期；

Last-Modified：指定返回数据的最后修改时间；

Refresh：指定浏览器定时刷新的时间；

Content-Type：指定回送数据的MIME类型。

六、HTTP Request header（以Fiddler工具为例）

使用fiddler工具能很方便的查看request header（请求报头），如下图所示：

（1）Client头域：包含了一些常见的请求报头：

　　a) Accept：

　　作用：浏览器端可以接受的媒体类型

　　例如：Accept: text/html 代表浏览器可以接受服务器返回的类型为text/html，即html文档。如果服务器无法返回text/html类型的数据，服务器应该返回一个406错误。通配符*代表任意类型，例如：Accept: */* 代表浏览器可以处理所有类型（一般浏览器发给服务器都是发这个）

　　b) Accept-encoding：

　　作用：浏览器申明自己接收的编码方法，通常指定压缩方法，是否支持压缩，支持什么压缩方法（gzip，deflate），例如：Accept-encoding: gzip，deflate

　　c) Accept-language

　　作用：浏览器申明自己接收的语言（语言跟字符集的区别：中文是语言，中文有多种字符集，比如big5，gb2312，gbk等等）

　　例如：Accept-language: en-us

　　d) User-agent：

　　作用：告诉http服务器，客户端使用的操作系统和浏览器的名称和版本。

　　例如：User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.87 Safari/537.36

　　e) Accept-charset：

　　作用：浏览器申明自己接收的字符集，这就是前面介绍的字符集和字符编码，如：gb2312，utf-8

（2）Cookie/login头域

　　作用：最重要的header，将cookie的值发送给HTTP服务器

（3）Miscellaneous头域

　　Referer：提供了request的上下文信息的服务器，告诉服务器是从哪个链接过来的。比如从某个主页上链接到一个朋友那里，它的服务器就能够从HTTP Referer中统计出每天有多少用户点击主页上的链接访问它的网站。

（4）Transport头域

Connection：

Connection:keep-alive 当一个网页打开完成后，客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭，如果客户端再次访问这个服务器上的网页，会继续使用这一条已经建立的连接。

Connection:close 代表一个request完成后，客户端和服务端之间用于传输HTTP数据的TCP连接会关闭，当客户端再次发送request，需要重新建立TCP连接。

Host：发送请求时，该报头域是必须的

作用：主要用于指定被请求资源的Internet主机和端口号，他通常从HTTP URL中提取出来的。例如：在浏览器中输入http://192.168.1.xx:2400/province/，浏览器发送的请求消息中，就包含Host请求报头域，如下:

Host：http://192.168.1.xx:2400

三、 HTTP Response header

同样使用Fiddler查看Response header，如下图：

（1）Cache头域

　　Date：作用生成消息的具体时间和日期

　　例如： Date: Tue, 20 Dec 2016 06:39:15 GMT

　　Vary：

（2）Entity头域

　　Content-Type：web服务器告诉自己响应的对象的类型和字符集

　　Content-Length：指明实体正文的长度，以字节方式存储的十进制数字来表示

四、关于HTTP请求GET和POST的区别

1、 ①GET提交，请求的数据会附在URL之后（就是把数据放置在HTTP协议头＜request-line＞中），以?分割URL和传输数据，多个参数用&连接。例如：login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0%E5%A5%BD。如果数据是英文字母/数字，原样发送，如果是空格，转换为+，如果是中文/其他字符，则直接把字符串用BASE64加密，得出如： %E4%BD%A0%E5%A5%BD，其中％XX中的XX为该符号以16进制表示的ASCII。

　　②POST提交：把提交的数据放置在是HTTP包的包体＜request-body＞中。上文示例中红色字体标明的就是实际的传输数据。因此，GET提交的数据会在地址栏中显示出来，而POST提交，地址栏不会改变。

2、传输数据的大小：

　　首先声明,HTTP协议没有对传输的数据大小进行限制，HTTP协议规范也没有对URL长度进行限制。而在实际开发中存在的限制主要有：

　　①GET：特定浏览器和服务器对URL长度有限制，例如IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器，如Netscape、FireFox等，理论上没有长度限制，其限制取决于操作系统的支持。因此对于GET提交时，传输数据就会受到URL长度的限制。

　　②POST:由于不是通过URL传值，理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制，Apache、IIS6都有各自的配置。

3、安全性：

POST的安全性要比GET的安全性高。注意：这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不作数据修改，而这里安全的含义是真正的Security的含义，比如：通过GET提交数据，用户名和密码将明文出现在URL上，因为：

　　(1)登录页面有可能被浏览器缓存；

　　(2)其他人查看浏览器的历史纪录，那么别人就可以拿到你的账号和密码了。