LAMP(一)之http协议基础知识

URI:Uniform Resource Identifier

　　URL: Uniform Resource Locator,用于描述某服务器某特定资源的位置

　　URN: Uniform Resource Nameing

基本语法：
　　　　<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
　　　　　　scheme：url方案
　　　　　　<user>:<password> : 用户名密码
　　　　　　<host>:<port> : 服务器地址 
　　    　 <path> : 资源路径
　　　　　　params: 参数
　　　　　　　　http://www.magedu.com/bbs/hello;gender=f
　　　　　　query:
　　　　　　　　http://www.magedu.com/bbs/item.php?username=tom&title=ab
　　　　　　frag: # ....

一次完整的http请求过程

        1. 建立或处理连接： 接收请求或拒绝请求
        2. 接收请求
            接收来自于网络的请求报文中对某资源的一次请求的过程

            并发访问响应模型 （Web I/O）:
                单线程I/O结构：启动一个进程处理用户请求，而且一次只处理一个：多个请求被串行响应
                多线程I/O结构：并行启动多个线程，每个进程响应一个请求
                复用I/O结构： 一个进程响应n个请求
                    多线程模型：一个进程生成N个线程，每个线程响应一个用户请求
                    事件驱动： event-driven
                复用的多进程I/O结构：启动多个（m）进程，每个进程响应n个请求

        3. 处理请求：对请求报文进行解析，并获取请求的资源及请求方法等相关信息

            元数据：请求报文首部
                <method> <URL> <VERSION>
                Host:www.magedu.com    请求的主机名称
                Connection:

        4.访问资源： 获取请求报文中请求的资源

            web服务器，即存放了web资源的服务器，负责向请求者提供对方请求的静态资源，或动态运行后生成的资源；这些资源放置于本地文件系统某路径下，此路径通常称为DocRoot

            /var/www.html
                images/1.jpg

            web服务器资源路径映射方式
                a. docroot
                b. alias
                c. 虚拟主机docroot
                d. 用户家目录docroot

        5. 构建响应报文

            资源的MIME类型
                显示分类
                魔法分类
                协商分类

            URL重定向：
                web服务构建的响应并非客户端请求的资源，而是资源另外一个访问路径
        6. 发送响应报文
        7. 记录日志

http协议：hyper text transfer protocol （80/tcp）

　　　　版本
　　　　　　　HTTP/0.9: 原型版本，简陋
            HTTP/1.0: 第一个广泛使用的版本，引用了MIME机制,但是缓存机制比较简陋　　
　　　　　　　　　　MIME: Multipurpose Internet Mail Extension 多用途网络邮件扩展
　　         HTTP/1.1: 增强了缓存功能
            HTTP/2.0:

　　httpd协议：stateless, 服务器无法持续追踪访问来源, 基于cookie、session机制来追踪客户端的行为　　

　　http事务：一次请求(request)和一次响应(response)的过程　　

　　　request报文
    　　<method><request-URL><version>　　
   　　 <headers>

   　　 <entity-body>
　　　response报文
   　　 <version><status><reason-phrase>　　//version：HTTP/<major>.<minor>;status:三位数字标记请求处理过程中的情况；reason-phrase:状态码所标记的状态的简要描述
  　　  <headers>　　//每个请求或响应报文可包含任意个首部
   　　
   　 <entity-body>　　//请求时附加的数据或响应时附加的数据

method（方法）
    GET: 从服务器获取一个资源
    HEAD: 只从服务器获取文档的响应首部
    POST：向服务器发送要处理的数据
    PUT： 将请求的主体部分存储在服务器上
    DELETE： 请求删除服务器上指定的文档
    TRACE： 追踪请求到达服务器中间经过的代理服务器
    OPTIONS： 请求服务器返回对指定资源支持使用的请求方法

status(状态码)
    1XX: 100-101，信息提示
    2XX: 200-206， 成功类信息
    3XX：300-305， 重定向，提示需进一步提供补充类信息的状态码
    4XX： 400-415，客户端错误
    5XX： 500-505，服务器端错误
    
    常用的状态码：
        200：成功，请求的所有数据通过响应报文的entity-body部分发送：OK
        301: 请求的url指向的资源已经被删除；但在响应报文中通过首部location指明了资源现在所处的位置，永久重定向
        302： 与301相似，但在响应报文中通过location指明了资源现在所处的临时位置
        304：客户端发出了条件式请求，但服务器上的资源未曾发生改变，则通过响应此状态码通知客户端，not modify
        401： 需要输入账号和密码认证方能访问资源：unauthorized
        403: 请求被禁止,forbidden
        404： 服务器无法找到客户端请求的资源，not found
        500: 服务器内部错误： internal server error
        502: 代理服务器从后端服务器收到了一条伪响应，bad gateway

header

　　格式：

　　　　Name : Value

　　首部分类：

　　　  通用首部
　　　　请求首部
　　　　响应首部
　　　　实体首部
　　　　扩展首部

通用首部：
                          Date： 报文的创建时间
                          connection: 连接方式，如keep-alive,close
                          via: 显示报文经过的中间节点
                          cache-control：控制缓存
                          pragma：

请求首部：
                        accept: 通过服务器自己可接受的媒体类型
                        accept-charset:
                        accept-encoding: 接受编码格式，如gzip
                        accept-language: 接受的语言

                        client-IP：客户端IP
                        Host: 请求的服务器名称和端口号
                        Referer: 包含当前正在请求的资源的上一级资源
                        User-Agent: 客户端代理

                        条件式请求首部
                            expect：期望发什么信息
                            if-modify-since: 自从指定的时间之后，请求的资源是否发生修改过
                            if-unmodified-since: 自从指定的时间之后，请求的资源是否没有修改
                            if-none-match: 本地缓存中存储的文档的etag标签是否与服务器文档的etag不匹配
                            if-match：本地缓存中存储的文档的扩展标签etag是否与服务器文档的etag匹配

                        安全请求首部：
                            authorization: 向服务器发送认证信息，如账号和密码
                            cookie: 客户端向服务器端发送cookie
                            cookie2

                        代理请求首部：
                            proxy-authorization:向代理服务器认证

响应首部：
                        信息性：
                            age: 响应持续时长
                            server：服务器程序软件名称和版本

                        协商首部：某资源有多种表示方法时使用
                            accept-ranges: 服务器可接受的请求范围类型
                            vary: 服务器查看的其他首部列表

                        安全响应首部
                            set-cookie: 向客户端设置cookie
                            set-cookie2：向客户端设置第二版的cookie
                            www-authenticate: 来自服务器的对客户端的质询认证表单

实体首部：
                        allow: 列出对此实体可使用的请求方法
                        location: 告诉客户端真正的实体位于何处，重定向时使用

                        content-encoding：内容的编码格式
                        content-language：内容的语言
                        content-length: 主体的长度
                        content-location: 实体真正所处位置
                        content-type: 主体的对象类型

                        缓存相关
                            eTag: 实体的扩展标签
                            expires: 实体的过期时间
                            last-Modified: 最后一次修改的时间

协议查看或分析的工具：

tcpdump, tshark, wireshark