并发与高并发（二十一）高并发の应用限流思路

前言

这一章节我们将讲解高并发解决方案中的应用限流思路。像我们之前讲的股票数据并没有把他们直接存放到数据库，而是放到Redis中，利用缓存保证用户能看到的数据的实时性和准确性。

主体概要

限流概念
应用限流示例
应用限流算法

主体内容

一、限流概念

限流就是通过对并发访问/请求进行限速或一个时间窗口内的请求进行限速，从而达到保护系统的目的。一般系统可以通过压测来预估能处理的峰值，一旦达到设定的峰值阀值，则可以拒绝服务（定向错误页或告知资源没有了）、排队或等（例如：秒杀、评论、下单）、降级（返回默认数据）。

限流不能乱用，否则正常流量会出现一些奇怪的问题，从而导致用户抱怨。

二、应用限流示例

示例图

如果不做处理，130w-140w的数据会被某一时刻插入数据库，这时网络开销拉满，其他请求将无法获得资源。有的还有主库Master和从库slave，这时就会导致从库和主库的延迟特别大，那么从库查询到的数据不准确的概率会非常大。而我们要是放慢插入数据库的速度，又会是怎么样呢？结果就是如图所示，以恒定速率插入主库，从库也能保证正常同步数据。至于这个恒定速率是要根据实际场景来计算的。

三、应用限流算法

计数器法
滑动窗口
漏桶算法
令牌桶算法

1.计数器法（最简单，最容易实现的一种算法）

有时我们还会使用计数器来进行限流，主要用来限制一定时间内的总并发数，比如数据库连接池、线程池、秒杀的并发数；计数器限流只要一定时间内的总请求数超过设定的阀值则进行限流，是一种简单粗暴的总数量限流，而不是平均速率限流。

比如说我们A接口1分钟访问次数不能超过100次。那么我们可以这么做，在一开始的时候，我们设置一个计数器counter，每当一个请求过来的时候，counter就加1，如果counter值大于100并且与刚开始请求的时间间隔在1分钟之内，那么我们就重置这个counter。

这个方法有一个致命问题：临界问题——当遇到恶意请求，在0:59时，瞬间请求100次，并且在1:00请求100次，那么这个用户在1秒内请求了200次，用户可以在重置节点突发请求，而瞬间超过我们设置的速率限制，用户可能通过算法漏洞击垮我们的应用。

可以看出来，这是我们计算的精度太低导致的问题，解决办法就是增加精度。

2.滑动窗口

在上图中，整个红色矩形框是一个时间窗口，在我们的例子中，一个时间窗口就是1分钟，然后我们将时间窗口进行划分，如上图我们把滑动窗口划分为6格，所以每一格代表10秒，每超过10秒，我们的时间窗口就会向右滑动一格，每一格都有自己独立的计数器，例如：一个请求在0:35到达，那么0:30到0:39的计数器会+1，那么滑动窗口是怎么解决临界点的问题呢？如上图，0:59到达的100个请求会在灰色区域格子中，而1：00到达的请求会在红色格子中，窗口会向右滑动一格，那么此时间窗口内的总请求数共200个，超过了限定的100，所以此时能够检测出来触发了限流。回头看看计数器算法，会发现，其实计数器算法就是窗口滑动算法，只不过计数器算法没有对时间窗口进行划分，所以是一格。由此可见，当滑动窗口的格子划分越多，限流的统计就会越精确。

3.漏桶算法（Leaky Bucket）

这个算法很简单。首先，我们有一个固定容量的桶，有水进来，也有水出去。对于流进来的水，我们无法预计共有多少水流进来，也无法预计流水速度，但对于流出去的水来说，这个桶可以固定水流的速率，而且当桶满的时候，多余的水会溢出来。

4.令牌桶算法(Token Bucket)

从上图中可以看出，令牌算法有点复杂，桶里存放着令牌token。桶一开始是空的，token以固定的速率r往桶里面填充，直到达到桶的容量，多余的token会被丢弃。每当一个请求过来时，就会尝试着移除一个token，如果没有token，请求无法通过。可以很好的解决临界问题。

四、算法比较

计数器算法VS滑动窗口算法

计数器算法：最简单，可以看成是滑动窗口的低精度的实现，滑动窗口算法由于要处理多出来的计数器，就是每一个格子存一份，所以滑动窗口在实现上需要更多的存储空间。就是说滑动窗口窗口越多，精度越高，需要的存储空间就越大。

漏桶算法VS令牌桶算法

令牌桶算法：以固定的速率(平均速率)生成对应的令牌放到桶中，客户端只需要在桶中获取到令牌后，就可以访问服务请求。

漏桶算法：以任意速率往桶中放入水滴，如果桶中的水滴没有满的话，可以访问服务。

在突发情况请求的时候，令牌桶中只需要客户端你能够拿到令牌就能访问服务。但是漏桶算法正好与令牌桶算法相反，令牌桶以平均速率访问，漏桶算法平滑访问。

并发与高并发（二十一） 高并发の应用限流思路

前言