HTTP笔记整理(2)

四、  http协议之请求

1、http请求由三部分组成,分别是:请求行(request line)、请求报头(request header)、请求正文(body)

(1)、  请求行:用来说明请求类型、要访问的资源以及使用的http版本

(2)、请求报头:用来说明服务器要使用的附加信息

(3)、正文:和header之间要有一个空行,可添加任意的其他数据

2、常用的请求报头:

            Accept:用于指定客户端接受哪些类型的信息,如:image/gif,表明客户端希望接受GIF图像格式的资源;

            Accept-charset:用于指定客户端接受的字符集,如:Accept-charset:iso-8859-1,gb2312。

            注:如果请求信息中没有设置这个,则缺省是默认任何字符集都可接受。

            Accept-encoding:类似于Accept,用于指定可接受的内容编码。如果请求信息中没有设置这个,则缺省是默认任何字符集都可接受。

            Accept-language:指定一种自然语言

            Authorization:用于证明客户端有权查看某个资源。当浏览器访问一个页面时,如果收到服务器的响应代码为401(未授权),可以发送一个包含Authorization请求报头域的请求,要求服务器对其进行验证。

            User-Agent:允许客户端将其操作系统、浏览器和其他属性告诉服务器。(不是必需的)

五、  http协议之响应

1、  http响应也由三部分组成,分别是:状态行(request line)、响应报头(request header)、响应正文(body)

       header与body之间有空行。    

     

      Method表示请求方法(“post“或”get“),path-to-resource表示请求的资源,Http/version-number表示HTTP协议的版本号。

      注意:当使用“GET”方法的时候,body(请求数据)为空!如下图所示:

      

      状态代码有三位数字组成,第一个数字定义了响应的类别,有5种可取值:

                     1xx:指示信息,表示请求已接收,继续处理;

                     2xx:成功,表示请求已被成功接收、理解、接受;

                     3xx:重定向,要完成请求必须进行更进一步的操作;

                     4xx:客户端错误,请求有语法错误或请求无法实现;

                     5xx:服务器端错误,服务器未能实现合法的请求。

2、  常见状态码、状态描述、说明

        200:OK  //客户端请求成功

        400:Bad Request //客户端请求有语法错误,不能被服务器所理解

        401:Unauthorized //请求未经授权,这个状态码必须和www-Authenticate报头域一起使用

        403:forbidden //服务器收到请求,但是拒绝提供服务

        404:not found //请求资源不存在

        500:Internal Server Error //服务器发生不可预期的错误

        503:Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常。

3、  常见的响应报头

        Server:指定服务器名称,包含了处理请求的服务器使用的软件产品信息。与User-Agent请求报头域是相对应的;

        Location:重定向请求者到一个新的URL地址。常用在更换域名的时候;

        Allow:指出服务器所支持的请求方式,如GET、POST等方法;

        Content-Encoding:指定文档的编码方法;

        Content-Length:指定响应中数据的字节长度;

        Date:指定发送http消息的日期;

        Last-Modified:指定返回数据的最后修改时间;

        Refresh:指定浏览器定时刷新的时间;

        Content-Type:指定回送数据的MIME类型。

 

六、HTTP Request header(以Fiddler工具为例)

使用fiddler工具能很方便的查看request header(请求报头),如下图所示:

 

(1)Client头域:包含了一些常见的请求报头:

  a)      Accept:

  作用:浏览器端可以接受的媒体类型

  例如:Accept: text/html 代表浏览器可以接受服务器返回的类型为text/html,即html文档。如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误。通配符*代表任意类型,例如:Accept: */* 代表浏览器可以处理所有类型(一般浏览器发给服务器都是发这个)

  b)      Accept-encoding:

  作用:浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate),例如:Accept-encoding: gzip,deflate

  c)      Accept-language

  作用:浏览器申明自己接收的语言(语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等)

  例如:Accept-language: en-us

  d)      User-agent:

  作用:告诉http服务器,客户端使用的操作系统和浏览器的名称和版本。

  例如:User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.87 Safari/537.36

  e)      Accept-charset:

  作用:浏览器申明自己接收的字符集,这就是前面介绍的字符集和字符编码,如:gb2312,utf-8

(2)Cookie/login头域

  作用:最重要的header,将cookie的值发送给HTTP服务器

(3)Miscellaneous头域

  Referer:提供了request的上下文信息的服务器,告诉服务器是从哪个链接过来的。比如从某个主页上链接到一个朋友那里,它的服务器就能够从HTTP Referer中统计出每天有多少用户点击主页上的链接访问它的网站。

(4)Transport头域

Connection

   Connection:keep-alive 当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接。

   Connection:close 代表一个request完成后,客户端和服务端之间用于传输HTTP数据的TCP连接会关闭,当客户端再次发送request,需要重新建立TCP连接。

Host:发送请求时,该报头域是必须的

   作用:主要用于指定被请求资源的Internet主机和端口号,他通常从HTTP URL中提取出来的。例如:在浏览器中输入http://192.168.1.xx:2400/province/,浏览器发送的请求消息中,就包含Host请求报头域,如下:

                                       Host:http://192.168.1.xx:2400

 

三、  HTTP Response header

同样使用Fiddler查看Response header,如下图:

 

(1)Cache头域

  Date:作用生成消息的具体时间和日期

  例如:  Date: Tue, 20 Dec 2016 06:39:15 GMT

  Vary:

(2)Entity头域

  Content-Type:web服务器告诉自己响应的对象的类型和字符集

  Content-Length:指明实体正文的长度,以字节方式存储的十进制数字来表示

四、  关于HTTP请求GET和POST的区别

1、 ①GET提交,请求的数据会附在URL之后(就是把数据放置在HTTP协议头<request-line>中),以?分割URL和传输数据,多个参数用&连接。例如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0%E5%A5%BD。如果数据是英文字母/数字,原样发送,如果是空格,转换为+,如果是中文/其他字符,则直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX为该符号以16进制表示的ASCII。

  ②POST提交:把提交的数据放置在是HTTP包的包体<request-body>中。上文示例中红色字体标明的就是实际的传输数据。因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变。

2、  传输数据的大小:

  首先声明,HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。 而在实际开发中存在的限制主要有:

  ①GET:特定浏览器和服务器对URL长度有限制,例如IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器,如Netscape、FireFox等,理论上没有长度限制,其限制取决于操作系统的支持。 因此对于GET提交时,传输数据就会受到URL长度的限制。

  ②POST:由于不是通过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置。

3、  安全性:

     POST的安全性要比GET的安全性高。注意:这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不作数据修改,而这里安全的含义是真正的Security的含义,比如:通过GET提交数据,用户名和密码将明文出现在URL上,因为:

  (1)登录页面有可能被浏览器缓存;

  (2)其他人查看浏览器的历史纪录,那么别人就可以拿到你的账号和密码了。

原文地址:https://www.cnblogs.com/shanqw/p/6211014.html