HTTP 常用 Header 讲解

1,HTTP请求
协议名://主机名:端口号/资源URI

/*******************************
GET /index.html HTTP/1.1
Host: localhost:8088
connection: Keep-Alive

******************************/

2,request header
Host                     请求头,标名请求主机器名,可为IP也可为域名,http1.1后强制使用,用此请求信息,可在服务端做WEB虚拟机,实现一机多WEB服务
Content-Length,  请求、响应体的数据字节大小
Accept-Encoding, 请求头,可接受的文本压缩算法,如: gzip, deflate
Accept-Language,请求头,支持语言,客户端浏览器的设置,如:zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
User- Agent,       请求头,浏览器信息,如:Mozilla/5.0 (Macintosh; Intel Mac OS X 10.7; rv:12.0) Gecko/20100101 Firefox/12.0,细心会注册到IE也会用Mozilla,这是一个历史问题,早期WEB服务器貌似有问题,只支持Mozilla,微软IE做为 后起之秀只能伪装成Mozilla
Cookie,              请求头,服务器或客户端在上次设置的COOKIE,包括作用域名(.360buy.com),过 期时间,键与值。大部分WEB服务器都会在第一次访问时在响应头上加Set-Cookie, (指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密))如:BAIDUID=49415814CDBBB4CE65EC50EE4BB65E9A:FG=1; expires=Wed, 07-Nov-42 07:03:34 GMT; path=/; domain=.baidu.com
Referer,             从一个连接打开一个新页面,新页面的请求一般会加此信息,标名是从哪里跳过来的,所有的页面的打开历史链就可被挖掘出来,有利于分析用户行为与CPS分成

3,reponse header
Content-Type,         响应的数据类型:text/html;charset=gbk
Content-Length,    响应的数据体大小
Content-Encoding,   如果为文本、HTML信息,则使用的编码方式
Date,                      当前服务器日期
Server,                   服务器名
Set- Cookie,          第一次访问或服务设置COOKIE时,响应头里会有此信息, 如,BAIDUID=49415814CDBBB4CE65EC50EE4BB65E9A:FG=1; expires=Wed, 07-Nov-42 07:03:34 GMT; path=/; domain=.baidu.com

4,  Cache-Control , Expires
控制缓存的两个响应头,如果都出现在响应头里,按Cache-Controler计算
Cache-Control,    为响应头信息,取值为:
Public,                当前系统任何登录的用户都可使用
Private,              当前系统登录的此用户进行缓存
no-cache,           不做缓存
max-age,           缓存指定秒数,如Cache-control: max-age=5,表示当访问此网页后的5秒内再次访问不会去服务器
Expires,             为响应头,Http1.1以上版本,与Max-Age一样,用来控制缓存的失效日期



5, Last-Modified,  If-Modified-Since
Last-Modified,       为响应头,标名本资料上一次的修改时间
If-Modified-Since,为请求头,把上一次请求的Last-Modified日期信息为值进行请求,如果服务器判断Last-Modified时间与服务器一致则直接返回304,浏览器使用本地缓存进行显示。一般用来节省带宽,加速请求与显示。

6,ETag + If-Match
同样是缓存策略,做为以上的补充
ETag,      为响应头,在 http1.1中规定为一个字串,具体格式未定义,用来校验客户端缓存
If-Match, 为请求头信息,把上一次请求响应的Etag带上进行请求,服务端的处理方法比较灵活,做为Cache-Control,Expires,Last-Modified的补充,可不以时间为参考的缓存策略。
Apache默认对html的Etag取值为INode+Mtime+Size
如:Etag"2e681a-6-5d044840"1
用途:
a,仅仅改变的修改时间,但内容未做修改
b,修改非常频繁,一秒内修改千次,但Cache-Control与Last-Modified,只能控制在秒级,这是对控制力度的进一步提升
c,某些服务器不能精确的得到文件的最后修改时间,个例,我们使用的服务器都已支持,所以所用不多

7,Connection Keep-Alive
HTTP协议采用TCP协议,每次页面资源请求都被规定为一次连接,而每次连接的TCP三次握手关闭时的四次通信与端口滞留等待防止数据包未传送,
而每个TCP都是一个打开文件IO句柄数,Unix/Linux又对这个做了严格的限制。
一个网页,大量资源文件(htmlcssjavascriptimage)需要加载量时需要大数据量的TCP连接,为了减少socket连接数提供了KeepAlive,使一个tcp连接可重复使用。
事实也证明用Keep-Alive速度也更快(但移动客户端接口开发会关掉此属性)。

8,Range:  10-100
取信息的一部分,断点下载时常用

9,返回状态码
200,返回成功
501,服务器内容错误
304,使用本地缓firebug
404,资源没有找到

10,http 协议监察工具:
Firebox: httpfox、live http header,firebug
IE:        httpwatch、iehttpheader

原文地址:https://www.cnblogs.com/CafeWing/p/3555609.html