【slighttpd】基于lighttpd架构的Server项目实战(6)—预备知识之Http

接下来,我们開始http部分的开发。

在此之前。有必要先学习一下HTTP协议~

http1.1 的rfc文档:http://www.ietf.org/rfc/rfc2616.txt

简单介绍

超文本传输协议(Hypertext Transfer Protocol。简称HTTP)是应用层协议,是一种请求/响应式的协议,即一个client与server建立连接后,向server发送一个请求,server接到请求后。给予相应的响应信息。

HTTP 请求报文

HTTP 请求报文由请求行、请求头部、空行 和 请求体 4 个部分组成:

|  请求方法 | URL | 协议版本号 |     ->请求行
|  请求头部(Request Header) |
|  空行                     |
|  body                    |

【请求行】:由方法字段、URL 字段 和HTTP 协议版本号字段 3 个部分组成,他们之间使用空格隔开。经常使用的 HTTP 请求方法有 GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT;

样例:
GET /index.jsp?id=100&op=bind HTTP/1.1

● GET:当client要从server中读取某个资源时,使用GET 方法。

GET 方法要求server将URL 定位的资源放在响应报文的数据部分。回送给client。即client向server请求某个资源。使用GET 方法时,请求參数和相应的值附加在 URL 后面,利用一个问号(“?”)代表URL 的结尾与请求參数的開始。传递參数长度受限制。

比如,/index.jsp?

id=100&op=bind。

● POST:当client给server提供信息较多时能够使用POST 方法,POST 方法向server提交数据。比方完毕表单数据的提交。将数据提交给server处理。GET 一般用于获取/查询资源信息,POST 会附带用户数据,一般用于更新资源信息。

POST 方法将请求參数封装在HTTP 请求数据中,以名称/值的形式出现,能够传输大量数据;

● PUT:用于改动某个内容。

● DELETE:删除某个内容。

● CONNECT:用于代理进行传输。如使用SSL;

● OPTIONS:询问能够运行哪些方法;

● PATCH:部分文档更改;

● PROPFIND, (wedav):查看属性;

● PROPPATCH, (wedav): 设置属性;

● MKCOL, (wedav):创建集合(目录);

● COPY, (wedav):拷贝;

● MOVE, (wedav):移动;

● LOCK, (wedav):加锁。

● UNLOCK (wedav):解锁。

● TRACE:用于远程诊断server。

● HEAD:相似于GET, 可是不返回body信息。用于检查对象是否存在,以及得到对象的元数据;

【请求头部】:请求头部由key/value对组成,每对一行,keyword和值用英文冒号“:”分隔。请求头部通知server有关于client请求的信息。典型的请求头有:

● User-Agent:产生请求的浏览器类型;

● Accept:client可识别的响应内容类型列表;星号 “ * ” 用于按范围将类型分组。用 “ */* ” 指示可接受所有类型,用“ type/* ”指示可接受 type 类型的所有子类型;

● Accept-Language:client可接受的自然语言;

● Accept-Encoding:client可接受的编码压缩格式;

● Accept-Charset:可接受的应答的字符集;

● Host:请求的主机名,同意多个域名同处一个IP 地址,即虚拟主机;

● connection:连接方式(close 或 keepalive);

close:告诉 WEB server或者代理server,在完毕本次请求的响应后,断开连接,不等待本次连接的兴许请求了。
keepalive:告诉WEBserver或者代理server,在完毕本次请求的响应后,保持连接。等待本次连接的兴许请求;

● Cookie:存储于client扩展字段。向同一域名的服务端发送属于该域的cookie;

【空行】:最后一个请求头之后是一个空行。发送回车符和换行符,通知server下面不再有请求头;

【请求包体】:请求包体不在 GET 方法中使用。而是在POST 方法中使用。POST 方法适用于须要客户填写表单的场合。与请求包体相关的最常使用的是包体类型 Content-Type 和包体长度 Content-Length。

HTTP响应报文

HTTP 响应报文由状态行、响应头部、空行 和 响应包体 4 个部分组成:

|  协议版本号 | 状态码 | 状态码描写叙述 |  ->状态行
|  响应头(Response Header)      |
|  空行                         |
|  响应正文                     |

【状态行】:状态行由 HTTP 协议版本号字段、状态码和状态码的描写叙述文本 3 个部分组成,他们之间使用空格隔开;

● 状态码由三位数字组成。第一位数字表示响应的类型,经常使用的状态码有五大类例如以下所看到的:

1xx:表示server已接收了client请求,client可继续发送请求;

2xx:表示server已成功接收到请求并进行处理;

3xx:表示server要求client重定向;

4xx:表示client的请求有非法内容;

5xx:表示server未能正常处理client的请求而出现意外错误;

● 状态码描写叙述文本有例如以下取值:

200 OK:表示client请求成功;

400 Bad Request:表示client请求有语法错误,不能被server所理解;

401 Unauthonzed:表示请求未经授权,该状态代码必须与 WWW-Authenticate 报头域一起使用;

403 Forbidden:表示server收到请求,可是拒绝提供服务,一般会在响应正文中给出不提供服务的原因;

404 Not Found:请求的资源不存在,比如。输入了错误的URL;

500 Internal Server Error:表示server发生不可预期的错误,导致无法完毕client的请求;

503 Service Unavailable:表示server当前不能够处理client的请求,在一段时间之后,server可能会恢复正常;

【响应头部】:请求头部由key/value对组成,每对一行,keyword和值用英文冒号“:”分隔。部分例如以下:

● Location:用于重定向接受者到一个新的位置。比如:client所请求的页面已不存在原先的位置,为了让client重定向到这个页面新的位置。server端能够发回Location响应报头后使用重定向语句,让client去訪问新的域名所相应的server上的资源;

● Server:Server 响应报头域包括了server用来处理请求的软件信息及其版本号。它和 User-Agent 请求报头域是相相应的,前者发送server端软件的信息,后者发送client软件(浏览器)和操作系统的信息。

● Vary:指示不可缓存的请求头列表;

● Connection:连接方式;
(close:连接已经关闭;
keepalive:连接保持着,在等待本次连接的兴许请求; )

● Keep-Alive:假设浏览器请求保持连接。则该头部表明希望WEB server保持连接多长时间(秒);比如:Keep-Alive:300;

● WWW-Authenticate:WWW-Authenticate响应报头域必须被包括在401 (未授权的)响应消息中,这个报头域和前面讲到的Authorization 请求报头域是相关的。当client收到 401 响应消息,就要决定是否请求server对其进行验证。假设要求server对其进行验证。就能够发送一个包括了Authorization 报头域的请求;

【空行】:最后一个响应头部之后是一个空行,发送回车符和换行符,通知server下面不再有响应头部。

【响应包体】:server返回给client的文本信息;

HTTP 无状态性

HTTP 协议是无状态的(stateless)。也就是说。同一个client第二次訪问同一个server上的页面时,server无法知道这个client以前訪问过,server也无法分辨不同的client。

HTTP 的无状态特性简化了server的设计。使server更easy支持大量并发的HTTP 请求。

HTTP 持久连接

HTTP1.0 使用的是非持久连接,主要缺点是client必须为每个待请求的对象建立并维护一个新的连接。即每请求一个文档就要有两倍RTT 的开销。由于同一个页面可能存在多个对象。所以非持久连接可能使一个页面的下载变得十分缓慢,并且这样的短连接添加了网络传输的负担。

HTTP1.1 使用持久连接keepalive。所谓持久连接,就是server在发送响应后仍然在一段时间内保持这条连接,同意在同一个连接中存在多次数据请求和响应,即在持久连接情况下,server在发送完响应后并不关闭TCP 连接,而client能够通过这个连接继续请求其它对象。

HTTP/1.1 协议的持久连接有两种方式:

● 非流水线方式:客户在收到前一个响应后才干发出下一个请求;

● 流水线方式:客户在收到 HTTP 的响应报文之前就能接着发送新的请求报文。

好啦~http的基本知识就介绍到这里,接下来我们将针对http来为我们的server加入功能,对于http的解析部分,我不打算自己写,将使用一个第三方的解析库http-parser。

原文地址:https://www.cnblogs.com/mfmdaoyou/p/7106159.html