浏览器缓存

前言

在前端开发中，缓存有利于加快网页的加载速度，同时缓存能够被反复利用，所以可以减少流量和带宽的开销。

缓存的分类有很多种，CDN缓存、数据库缓存、代理服务器缓存和浏览器缓存。本篇将来讲解一下Web开发中的浏览器缓存。这个在实际开发环境中往往也会被问到，或者使用到。如何去准确认清楚缓存的概念，是前端必须要去学习的。

正文

浏览器的缓存问题，主要指的是http的缓存——即协议层。而h5新增的storage和数据库缓存，那是应用层缓存，并不被计入本篇的分析内容里面。下面我们正式开始来进行缓存的分析。

协议层的缓存，其实，可以被分成强制缓存和对比缓存（又名协商缓存）。

强制缓存

首先，我们先来看一张强制缓存时的时序图，来了解一下强制缓存在不同情况下的请求模式：

从图中，我们不难看出，只有当缓存失效时，才会去服务器获取最新资源的方式，就是强制缓存。而在协议层的字段中，可以造成强制缓存的字段有两个Expires和Cache-Control。

1.0的时候见到我——Expires

最早使用的是Expires字段，该字段表示缓存到期时间，即有效时间+当时服务器的时间，然后将这个时间设置在header中返回给浏览器。因此，该时间是一个绝对时间，举例说明：

Expires: Thu, 10 Nov 2017 08:45:11 GMT

在响应消息头中，设置这个字段之后，就可以告诉浏览器，在未过期之前不需要再次请求。

但是，这个字段设置时有缺点：

由于是绝对时间，用户可能会将客户端本地的时间进行修改，而导致浏览器判断缓存失效，重新请求该资源，同时，还导致客户端与服务端的时间不一致，致使缓存失效。

1.1的时候我来了——Cache-Control

已知Expires的缺点之后，在HTTP/1.1中，增加了一个字段Cache-Control，该字段表示资源缓存的最大有效时间，在该时间内，客户端不需要向服务器发送请求

这两者的区别就是前者是绝对时间，而后者是相对时间。我们不妨举个例子来说明一下：

Cache-Control: max-age=2592000

下面列举一下Cache-Control的字段可以带的值：

max-age：即最大有效时间，在上面的例子中我们可以看到
no-cache：表示没有缓存，即告诉浏览器该资源并没有设置缓存，有协商缓存的时候走协商缓存
s-maxage：同max-age，但是仅用于共享缓存，如CDN缓存
public：多用户共享缓存，默认设置，可以被所有用户缓存，包括终端用户和cdn等中间代理服务器。
private：不能够多用户共享，HTTP认证之后，字段会自动转换成private，只能被终端用户的浏览器缓存，不允许cdn等中继缓存服务器对其缓存。
no-store：直接禁止浏览器缓存数据，每次用户都需要从服务器请求完整的资源。

总结一下，自从http1.1开始，Expires逐渐被Cache-Control取代。Cache-Control是一个相对时间，即使客户端时间发生改变，相对时间也不会随之改变，这样可以保持服务器和客户端的时间一致性。而且Cache-Control的可配置性比较强大。

同样cache-control也有强制缓存的缺点，如果服务器资源已经更新，浏览器缓存还没有失效，浏览器没有办法获取最新的代码。

对比缓存

扯完强制缓存，我们来看看对比缓存。在解释这个之前，是否可以先猜想一下，强制缓存是，缓存在未过有效期时，不需要请求资源。那么，对比缓存的原理又该如何呢？

对比缓存的过程是，先从缓存中获取对应的数据标识，然后向服务器发送请求，确认数据是否更新，如果更新，则返回新数据和新缓存；反之，则返回304状态码，告知客户端缓存未更新，可继续使用。

这正好弥补了一些强制缓存的缺陷。对比缓存主要应用于一些时常需要动态更新的资源文件。

对比缓存在协议里的字段是Last-Modified和If-Modified-Since。

别人的好伙伴——Last-Modified

Last-Modified：服务器告知客户端，资源最后一次被修改的时间，例如

Last-Modified: Thu, 10 Nov 2015 08:45:11 GMT

If-Modified-Since：再次请求时，请求头中带有该字段，服务器会将If-Modified-Since的值与Last-Modified字段进行对比，如果相等，则表示未修改，响应304；反之，则表示修改了，响应200状态码，返回数据。

这个字段可以和Cache-Control配合使用。

但是他还是有一定缺陷的：

如果资源更新的速度是秒以下单位，那么该缓存是不能被使用的，因为它的时间单位最低是秒。
如果文件是通过服务器动态生成的，那么该方法的更新时间永远是生成的时间，尽管文件可能没有变化，所以起不到缓存的作用。

我来完善它——Etag

由于Last-modified还是存在缺陷的，尽管大多数情况下，会使用它，但当遇到我们上面所说的场景时，我们可能就需要了解一下，我们另一个小伙伴了——Etag。

Etag存储的是文件的特殊标识(一般都是hash生成的)，服务器存储着文件的Etag字段，可以在与每次客户端传送If-no-match的字段进行比较，如果相等，则表示未修改，响应304；反之，则表示已修改，响应200状态码，返回数据。

最后，通过一张原理图，我们来加深一下记忆：

至此为止，两种缓存类型的缓存方式已经阐述完成了，不知你是否已经心中已经有个大致的印象，当别人问起时，你可以对答如流。希望我们一同进步吧，fighting。

浏览器行为引起的不同

最后，我们来聊聊浏览器行为会引起缓存的变化吧。

下面说一下浏览器的行为会产生怎样的请求：

刷新网页 => 如果缓存没有失效，浏览器会直接使用缓存；反之，则向服务器请求数据
手动刷新（F5） => 浏览器会认为缓存失效，在请求服务器时加上Cache-Control: max-age=0字段，然后询问服务器数据是否更新（强制缓存失效，协商缓存有效）。
强制刷新（Ctrl + F5） => 浏览器会直接忽略缓存，在请求服务器时加上Cache-Control: no-cache字段，然后重新向服务器拉取文件（强制缓存与协商缓存都失效）。

移动端的缓存处理

在PC端或许这样子的缓存机制就已经足够了，因为PC端不需要为网络的问题担心。

但是，移动端却不行，任何一个网络请求的增加，对于移动端的加载消耗时间都是比较大的（谁叫移动端的网太差呢，3G、2G）。那么，上述的缓存有什么问题呢？其实，强制缓存是没有太大问题的，因为只要缓存不到期，是不会想服务器发送请求的；但是如果是对比缓存的情况下，304的问题就比较巨大，因为它会造成无用的请求。每次在使用缓存前，都会向服务器发送请求确认，导致网络的延时。

一次完美的缓存必须保证两点：

数据缓存之后，尽量减少服务器的请求
如果资源更新的话，必须使得客户端的资源一起更新。

所以，一般我们会运用的方式是：

在资源文件后面加上表示，如config.f1ec3.js、config.v1.js之类的，然后给资源设置较长的缓存时间，如一年

Cache-Control: max-age=31536000

这样子，就不会造成304的回包现象。
然后一旦资源发生更新时，我们可以改变资源后面的标识符，实现静态资源非覆盖式更新。

缓存的优先级

几种缓存策略可以同时存在

1、对比缓存优先级 > 强制缓存优先级

2、对比缓存：Etag优先级 > Last-Modefied优先级

3、强制缓存：Cache-Control优先级 > Expires优先级

还有一种缓存program，优先级大于cache-control，不过几乎不用。

总结

本篇大致分析了浏览器缓存部分的分类情况，以及细化分析。主要可分为：

强制缓存
- Expires字段
- Cache-Control字段
对比缓存
- Last-Modefied字段
- Etag标识
浏览器行为引起的缓存变化
移动端的缓存策略

扩展：浏览器对文件的缓存

　　1、server cache：浏览器本地启动一个server work，决定缓存哪些文件以及缓存机制，这个是一个竞态机制，获取缓存的同时请求资源，哪个先返回用哪个，请求的资源（如果有修改）会被缓存，下一次生效。

　　2、memory cache：内存缓存

　　3、dist cache：硬盘缓存

　　4、push cache：http/2的推送资源

参考文献：

https://segmentfault.com/a/1190000011212929#articleHeader10