LAMP(一)之http协议基础知识

URI:Uniform Resource Identifier

  URL: Uniform Resource Locator,用于描述某服务器某特定资源的位置

  URN: Uniform Resource Nameing

基本语法:
    <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
      scheme:url方案
      <user>:<password> : 用户名密码
      <host>:<port> : 服务器地址 
        <path> : 资源路径
      params: 参数
        http://www.magedu.com/bbs/hello;gender=f
      query:
        http://www.magedu.com/bbs/item.php?username=tom&title=ab
      frag: # ....

一次完整的http请求过程

        1. 建立或处理连接: 接收请求或拒绝请求
        2. 接收请求
            接收来自于网络的请求报文中对某资源的一次请求的过程

            并发访问响应模型 (Web I/O):
                单线程I/O结构:启动一个进程处理用户请求,而且一次只处理一个:多个请求被串行响应
                多线程I/O结构:并行启动多个线程,每个进程响应一个请求
                复用I/O结构: 一个进程响应n个请求
                    多线程模型:一个进程生成N个线程,每个线程响应一个用户请求
                    事件驱动: event-driven
                复用的多进程I/O结构:启动多个(m)进程,每个进程响应n个请求

        3. 处理请求:对请求报文进行解析,并获取请求的资源及请求方法等相关信息

            元数据:请求报文首部
                <method> <URL> <VERSION>
                Host:www.magedu.com    请求的主机名称
                Connection:

        4.访问资源: 获取请求报文中请求的资源

            web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源;这些资源放置于本地文件系统某路径下,此路径通常称为DocRoot

            /var/www.html
                images/1.jpg

            web服务器资源路径映射方式
                a. docroot
                b. alias
                c. 虚拟主机docroot
                d. 用户家目录docroot

        5. 构建响应报文

            资源的MIME类型
                显示分类
                魔法分类
                协商分类

            URL重定向:
                web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
        6. 发送响应报文
        7. 记录日志

http协议:hyper text transfer protocol (80/tcp)

    版本
       HTTP/0.9: 原型版本,简陋 HTTP/1.0: 第一个广泛使用的版本,引用了MIME机制,但是缓存机制比较简陋  
          MIME: Multipurpose Internet Mail Extension 多用途网络邮件扩展
   HTTP/1.1: 增强了缓存功能 HTTP/2.0:

  httpd协议:stateless, 服务器无法持续追踪访问来源, 基于cookie、session机制来追踪客户端的行为  

  http事务:一次请求(request)和一次响应(response)的过程  

   request报文
      <method><request-URL><version>  
      <headers>

      <entity-body>
   response报文
      <version><status><reason-phrase>  //version:HTTP/<major>.<minor>;status:三位数字标记请求处理过程中的情况;reason-phrase:状态码所标记的状态的简要描述
      <headers>  //每个请求或响应报文可包含任意个首部
     
     <entity-body>  //请求时附加的数据或响应时附加的数据
method(方法)
    GET: 从服务器获取一个资源
    HEAD: 只从服务器获取文档的响应首部
    POST:向服务器发送要处理的数据
    PUT: 将请求的主体部分存储在服务器上
    DELETE: 请求删除服务器上指定的文档
    TRACE: 追踪请求到达服务器中间经过的代理服务器
    OPTIONS: 请求服务器返回对指定资源支持使用的请求方法
status(状态码)
    1XX: 100-101,信息提示
    2XX: 200-206, 成功类信息
    3XX:300-305, 重定向,提示需进一步提供补充类信息的状态码
    4XX: 400-415,客户端错误
    5XX: 500-505,服务器端错误
    
    常用的状态码:
        200:成功,请求的所有数据通过响应报文的entity-body部分发送:OK
        301: 请求的url指向的资源已经被删除;但在响应报文中通过首部location指明了资源现在所处的位置,永久重定向
        302: 与301相似,但在响应报文中通过location指明了资源现在所处的临时位置
        304:客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此状态码通知客户端,not modify
        401: 需要输入账号和密码认证方能访问资源:unauthorized
        403: 请求被禁止,forbidden
        404: 服务器无法找到客户端请求的资源,not found
        500: 服务器内部错误: internal server error
        502: 代理服务器从后端服务器收到了一条伪响应,bad gateway

header

  格式:

    Name : Value

  首部分类:

     通用首部
    请求首部
    响应首部
    实体首部
    扩展首部
通用首部:
                          Date: 报文的创建时间
                          connection: 连接方式,如keep-alive,close
                          via: 显示报文经过的中间节点
                          cache-control:控制缓存
                          pragma:
请求首部:
                        accept: 通过服务器自己可接受的媒体类型
                        accept-charset:
                        accept-encoding: 接受编码格式,如gzip
                        accept-language: 接受的语言

                        client-IP:客户端IP
                        Host: 请求的服务器名称和端口号
                        Referer: 包含当前正在请求的资源的上一级资源
                        User-Agent: 客户端代理

                        条件式请求首部
                            expect:期望发什么信息
                            if-modify-since: 自从指定的时间之后,请求的资源是否发生修改过
                            if-unmodified-since: 自从指定的时间之后,请求的资源是否没有修改
                            if-none-match: 本地缓存中存储的文档的etag标签是否与服务器文档的etag不匹配
                            if-match:本地缓存中存储的文档的扩展标签etag是否与服务器文档的etag匹配

                        安全请求首部:
                            authorization: 向服务器发送认证信息,如账号和密码
                            cookie: 客户端向服务器端发送cookie
                            cookie2

                        代理请求首部:
                            proxy-authorization:向代理服务器认证
响应首部:
                        信息性:
                            age: 响应持续时长
                            server:服务器程序软件名称和版本

                        协商首部:某资源有多种表示方法时使用
                            accept-ranges: 服务器可接受的请求范围类型
                            vary: 服务器查看的其他首部列表

                        安全响应首部
                            set-cookie: 向客户端设置cookie
                            set-cookie2:向客户端设置第二版的cookie
                            www-authenticate: 来自服务器的对客户端的质询认证表单
实体首部:
                        allow: 列出对此实体可使用的请求方法
                        location: 告诉客户端真正的实体位于何处,重定向时使用

                        content-encoding:内容的编码格式
                        content-language:内容的语言
                        content-length: 主体的长度
                        content-location: 实体真正所处位置
                        content-type: 主体的对象类型

                        缓存相关
                            eTag: 实体的扩展标签
                            expires: 实体的过期时间
                            last-Modified: 最后一次修改的时间

 协议查看或分析的工具:

tcpdump, tshark, wireshark
原文地址:https://www.cnblogs.com/ckh2014/p/10789733.html