HTTP相关面试题

 

TCP/IP四层协议体系结构?

由上至下顺序为:

(1)应用层(FTP、Telnet、SMTP、RIP、NFS、DNS)

(2)运输层(TCP、UDP)

(3)网际层(IP、ICMP、ARP、RARP)

(4)网络接口层

五层协议体系结构?

(1)应用层

(2)运输层

(3)网络层

(4)数据链路层

(5)物理层

OSI的七层体系结构?

(1)应用层

(2)表示层

(3)会话层

(4)运输层

(5)网络层

(6)数据链路层

(7)物理层

 

 巧记:P  Please  Physical

    D  Do  Data Link  

    N  Not  Network

    T  Tell  Transport

    S  Stupid  Session

    P  People  Presentation

    A  Anything  Application

HTTP请求的类型有哪些

HTTP/1.1协议中共定义了八种方法(有时也叫“动作”),来表明Request-URL指定的资源不同的操作方式

HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。

HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法

序号 方法 描述
1 GET 请求指定的页面信息
2 POST 向指定资源提交数据进行处理请求(如提交表单和上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立或已有资源的修改
3 HEAD 类似于get请求,但是返回的响应中没有具体的内容,用于获取报头
4 PUT 从客户端向服务器传送的数据取代指定的文档的内容
5 DELETE 请求服务器删除指定的页面
6 CONNECT  
7 OPTIONS 允许客户端查看服务器的性能
8 TRACE 回显服务器收到的请求,主要用于测试或诊断

HTTP报文组成部分

 http的请求报文由:请求行、首部(请求头)、空行、主体(请求书数据)四个部分组成。

1.请求行

 其中请求行由请求方法字段、URL字段和HTTP协议版本字段3个字段组成,它们用空格分隔。例如,GET /data/info.html HTTP/1.1

 方法字段就是HTTP使用的请求方法,比如常见的GET/POST,其中HTTP协议版本有两种:HTTP1.0/HTTP1.1,可以这样区别:HTTP1.0对于每个连接都只能传送一个请求和响应,请求就会关闭,HTTP1.0没有Host字段;而HTTP1.1在同一个连接中可以传送多个请求和响应,多个请求可以重叠和同时进行,HTTP1.1必须有Host字段。

2.请求头部

 Accept: 可接受的MIME类型。Accept-Charset:可接受的字符集。Accept-Encoding:浏览器能够进行解码的数据编码方式,比如gzip。Servlet能够向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这可以减少5到10倍的下载时间。Accept-Language:浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到。Authorization:授权信息,通常出现在对服务器发送的WWW-Authenticate头的应答中。Content-Length:表示请求消息正文的长度,对于POST请求来说 Content-Length必须出现。Host: 客户机通过这个头告诉服务器,想访问的主机名。Host头域指定请求资源的Intenet主机和端口号,必须表示请求url的原始服务器或网关的位置。HTTP/1.1请求必须包含主机头域Host,否则系统会以400状态码返回。

 If-Modified-Since:客户机通过这个头告诉服务器,资源的缓存时间。只有当所请求的内容在指定的时间后又经过修改才返回它,否则返回304“Not Modified”应答。Referer:客户机通过这个头告诉服务器,它是从哪个资源来访问服务器的(防盗链)。包含一个URL,用户从该URL代表的页面出发访问当前请求的页面。User-Agent:User-Agent头域的内容包含发出请求的用户信息。浏览器类型,如果Servlet返回的内容与浏览器类型有关则该值非常有用。Cookie:客户机通过这个头可以向服务器带数据,这是最重要的请求头信息之一。Pragma:指定“no-cache”值表示服务器必须返回一个刷新后的文档,即使它是代理服务器而且已经有了页面的本地拷贝。From:请求发送者的email地址,由一些特殊的Web客户程序使用,浏览器不会用到它。Connection:处理完这次请求后是否断开连接还是继续保持连接。如果Servlet看到这里的值为“Keep- Alive”,或者看到请求使用的是HTTP 1.1(HTTP 1.1默认进行持久连接),它就可以利用持久连接的优点.Range:Range头域可以请求实体的一个或者多个子范围。

3.空行

 通过一个空行,告诉服务器请求头部到此为止。

4.请求数据

 若方法字段是GET,则此项为空,没有数据。若方法字段是POST,则通常来说此处放置的就是要提交的数据

 比如要使用POST方法提交一个表单,其中有user字段中数据为“admin”, password字段为123456,那么这里的请求数据就是 user=admin&password=123456,使用&来连接各个字段。

 

HTTP和HTTPS的区别

(1)http和https的基本概念

http:超文本传输协议(HTTP,HyperText Transfer Protocol),是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(TCP,Transmission Control Protocol),用于从WWW服务器传输超文本到本地浏览器。

特点:无连接:限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

    无状态:无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快

    简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

    支持客户/服务器模式。(C/S模式)。

https:HTTPS(HyperText Transfer Protocol Secure)协议是由SSL(Secure Socket Layer,安全 套阶 层)+HTTP协议构建的可进行加密传输、身份认证的网络协议,要比HTTP协议安全。

https协议的主要作用是:建立一个信息安全通道,来确保数据的传输,确保网站的真实性

(2)http和https的区别

1、https协议需要到证书颁发机构(Certificate Authority,简称CA)申请证书,一般免费证书较少,因而需要一定费用。

2、http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。

3、http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。

4、http的连接很简单,是无状态的。

5、HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,比http协议安全。

 

(3)为什么要使用https

1、http协议的报文传输时不加密的,有些隐私信息存在被窃听的风险。

2、http协议通信时无法验证通信方身份,可能存在伪装者(客户端、服务器)

3、http协议无法判断通信报文的完整性,通信报文在TCP/IP协议通信中可能会被篡改

(4)SSL

SSL 技术最初是由浏览器开发商网景通信公司率先倡导的,开发 过 SSL3.0 之前的版本。目前主导权已转移到 IETF(Internet Engineering Task Force,Internet 工程任务组)的手中

SSL这层协议存在于应用层(http层)到TCP层之间

传输层安全协议TLS(Transport Layer Security,TLS)是SSL的标准化后的产物

 

TCP连接的三次握手和四次挥手

 

三次握手:

SYN置1表示这是一个连接请求或连接接受报文

TCP规定,只有当ACK=1时有效,也规定连接建立后所有发送的报文的ACK必须为1。

第一次握手:客户端向服务器发送请求报文请求建立连接。SYN=1,ACK=0表示这是一个连接请求报文,序号seq=x。发送完请求报文后,客户端进入SYN_SENT状态

第二次握手:服务器在接收了客户端的报文后结束LISTEN状态,并返回一段TCP报文,其中SYN=1,ACK=1,表示确认了序号seq有效,同意建立连接;将seq=y,ack=x+1也一同返回给客户端--确认号为ack=x+1,表示收到客户端的序号seq=x并将其值加1作为自己确认号Ack的值;返回报文后服务器进入SYN_RCVD状态

第三次握手:客户端收到服务器的响应后,结束SYN_SENT状态,并向服务器发送最后一段报文。ACK=1,表示确认收到了响应。序号为Seq=x+1,表示收到服务器端的确认号ack,并将其值作为自己的序号值;确认号为ack=y+1,表示收到服务器端序号seq=y,并将其值加1作为自己的确认号ack的值;随后客户端进入ESTABLISHED阶段。

服务器收到来自客户端的“确认收到服务器数据”的TCP报文之后,明确了从服务器到客户端的数据传输是正常的。结束SYN-SENT阶段,进入ESTABLISHED阶段。

在客户端与服务器端传输的TCP报文中,双方的确认号Ack和序号Seq的值,都是在彼此Ack和Seq值的基础上进行计算的,这样做保证了TCP报文传输的连贯性。一旦出现某一方发出的TCP报文丢失,便无法继续"握手",以此确保了"三次握手"的顺利完成。

此后客户端和服务器端进行正常的数据传输。这就是“三次握手”的过程。

 

四次挥手:

 

HTTP状态码

1**     信息,服务器收到请求,需要请求者继续执行操作
2**     成功,操作被成功接收并处理
3**     重定向,需要进一步的操作以完成请求
4**     客户端错误,请求包含语法错误或无法完成请求
5**     服务器错误,服务器在处理请求的过程中发生了错误

常见状态码

200 请求成功

请求已成功,请求所希望的响应头或数据体将随此响应返回。

301 永久重定向

被请求的资源已永久移动到新位置,并且将来任何对此资源的引用都应该使用本响应返回的若干个URI之一。

302 临时重定向

请求的资源现在临时从不同的URI响应请求。由于这样的重定向是临时的,客户端应当继续向原有地址发送以后的请求。

403 禁止访问

403错误类似于401错误,不同之处在于401错误是未经授权,而403错误是禁止访问。 任何登录对403错误都不起作用。 尝试访问(被禁止的)网站目录时,就会发生403错误。

404 文件未找到

大多数人都知道这个错误。 当用户试图访问Web服务器(通常是一个网页)上某个实际不存在的资源时,就会发生404错误。404错误可能是由无效的链接引起,也可能是URL拼写错误,还可能是因为虚拟主机将所请求页面移到其他地方(或删除所请求页面)。 一些网站设置了自定义页面以防止坏链接所产生的不良影响。

502 无效网关

作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。

 

小结TCP与UDP的区别:

1.基于连接与无连接;
2.对系统资源的要求(TCP较多,UDP少);
3.UDP程序结构较简单;
4.流模式与数据报模式;

5.TCP保证数据正确性,UDP可能丢包,TCP保证数据顺序,UDP不保证。

 

#TCPUDP
是否连接 面向连接 面向非连接
传输可靠性 可靠 不可靠
应用场合 少量数据 传输大量数据
速度

 


 

TCP与UDP区别总结:

1、TCP面向连接(如打电话要先拨号建立连接);UDP是无连接的,即发送数据之前不需要建立连接

2、TCP提供可靠的服务。也就是说,通过TCP连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP尽最大努力交付,即不保证可靠交付

3、TCP面向字节流,实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的UDP没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低(对实时应用很有用,如IP电话,实时视频会议等)

4、每一条TCP连接只能是点到点的;UDP支持一对一,一对多,多对一和多对多的交互通信

5、TCP首部开销20字节;UDP的首部开销小,只有8个字节

6、TCP的逻辑通信信道是全双工的可靠信道,UDP则是不可靠信道

post和get区别:

  • get参数通过url传递,post参数放在request body中。
  • get请求在url中传递的参数是有长度限制的,而post没有。
  • get比post更不安全,因为参数直接暴露在url中,所以不能用来传递敏感信息。
  • get请求只能进行url编码,而post支持多种编码方式
  • get请求参数会被完整保留在浏览历史记录里,而post中的参数不会被保留。
  • GET和POST本质上就是TCP链接,并无差别。但是由于HTTP的规定和浏览器/服务器的限制,导致他们在应用过程中体现出一些不同。
  • GET产生一个TCP数据包;POST产生两个TCP数据包。对于GET方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据);而对于POST,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。

浏览器缓存

缓存分为两种:强缓存和协商缓存,根据响应的header内容来决定。

  • 强缓存是利用http头中的Expires和cache-Control两个字段来控制的,用来表示资源的缓存时间。强缓存中,普通刷新会忽略它,但不会清除它,需要强制刷新。浏览器强制刷新,请求会带上cache-Control :no-cache和pragma: no-cache
  • 协商缓存就是由服务器来确定缓存资源是否可用,所以客户端与服务器端要通过某种标识来进行通信,从而让服务器判断请求资源是否可以缓存访问。
  • 普通刷新会启用弱缓存,忽略强缓存。只有在地址栏或收藏夹输入网址、通过链接引用资源等情况下,浏览器才会启用强缓存,这也是为什么有时候我们更新一张图片、一个js文件,页面内容依然是旧的,但是直接浏览器访问那个图片或文件,看到的内容却是新的。这个主要涉及到两组协商缓存相关的header字段:Etag和If-None-Match、Last-Modified和If-Modified-Since。

浏览器的缓存过程

浏览器请求某一资源时,会先获取该资源缓存的header信息,然后根据header中的cache-Control和Expires来判断是否过期。

  1. 若没过期则直接从缓存中获取资源信息,包括缓存的header的信息,所以此次请求不会与服务器进行通信。这里判断是否过期,则是强缓存相关。
  2. 如果显示已过期,浏览器会向服务器端发送请求,这个请求会携带第一次请求返回的有关缓存的header字段信息。

比如客户端会通过If-None-Match头将先前服务器端发送过来的Etag发送给服务器,服务会对比这个客户端发过来的Etag是否与服务器的相同, 若相同,就将If-None-Match的值设为false,返回状态304,客户端继续使用本地缓存,不解析服务器端发回来的数据,若不相同就将If-None-Match的值设为true,返回状态为200,客户端重新机械服务器端返回的数据;客户端还会通过If-Modified-since头将先前服务器端发过来的最后修改时间戳发送给服务器,服务器端通过这个时间戳判断客户端的页面是否是最新的,如果不是最新的,则返回最新的内容,如果是最新的,则返回304,客户端继续使用本地缓存。

如何解决前端开发中的缓存问题

  1. 对开发者来说,只要关闭浏览器缓存就可以了,找到network,Disable cache选项,打钩即可取消缓存。
  2. 开发者可以关闭缓存,但是不能要求所有用户都进行此类操作,此时可以在引用的文件之后拼接随机数或者日期都可以,如css/index.css?v=0.0001,浏览器就会认为是新的请求,而不会使用缓存中的文件。由于每次资源的修改都要更新引用的位置,同时修改参数的值,所以操作起来不是很方便,除非是在动态页面比如jsp中用服务器变量(v=${sysRnd})
  3. 如果缓存问题出现在ajax请求中,则在ajax请求的地址追加随机数
  4. 直接ctrl+f5,这个办法能解决页面直接引用的资源更新的问题
  5. 使用浏览器的隐私模式开发;
  6. 如果资源引用的页面,被嵌入到了一个iframe里面,可以在iframe的区域右键单击重新加载该页面
 
 
 
 
 
 
 
 
 
 

post和get区别:https://juejin.cn/post/6876623829574090760
原文地址:https://www.cnblogs.com/memeflyfly/p/14213143.html