精度不够,滑动时间来凑「限流算法第二把法器:滑动时间窗口算法」- 第301篇

一、回顾:计算器算法存在问题

对于秒级以上的时间周期来说,会存在一个非常严重的问题,那就是临界问题。

 从上图中我们可以看到,假设有一个恶意用户,他在0:59时,瞬间发送了100个请求,并且1:00又瞬间发送了100个请求,那么其实这个用户在 1秒里面,瞬间发送了200个请求。我们刚才规定的是1分钟最多100个请求,也就是每秒钟最多1.7个请求,用户通过在时间窗口的重置节点处突发请求, 可以瞬间超过我们的速率限制。用户有可能通过算法的这个漏洞,瞬间压垮我们的应用。

下面就说说如何解决这个由于问题。计算器的问题其实是因为我们统计的精度太低(统计的1秒内的流量情况,只有1个值进行记录)。那么如何很好地处理这个问题呢?或者说,如何将临界问题的影响降低呢?我们可以看下面的滑动窗口算法。

 二、滑动窗口算法

滑动窗口,又称rolling window。为了解决计数器法统计精度太低的问题,引入了滑动窗口算法。下面这张图,很好 地解释了滑动窗口算法:

      是一分钟。然后我们将时间窗口进行划分,比如图中,我们就将滑动窗口划成了6格,所以每格代表的是10秒钟。每过10秒钟,我们的时间窗口就会往右滑动一格。每一个格子都有自己独立的计数器counter,比如当一个请求 在0:35秒的时候到达,那么0:30~0:39对应的counter就会加1。

      那么滑动窗口怎么解决刚才的临界问题的呢?在上图中,0:59到达的100个请求会落在灰色的格子中,而1:00到达的请求会落在橘×××的格子中。当时间到达1:00时,我们的窗口会往右移动一格,那么此时时间窗口内的总请求数量一共是200个,超过了限定的100个,所以此时能够检测出来触发了限流。

      回顾一下上面的计数器算法,我们可以发现,计数器算法其实就是滑动窗口算法。只是它没有对时间窗口做进一步地划分,所以只有1格。

      由此可见,当滑动窗口的格子划分的越多,那么滑动窗口的滚动就越平滑,限流的统计就会越精确。

BTW

(1)滑动窗口算法是以当前这个时间点为基准,往前推移1秒进行计算当前1秒内的请求量情况。

(2)滑动窗口限流统计的精准度是由划分的格子多少决定的,这个怎么理解呐,就是把1秒中进行划分成多个时间段,比如2个格子的话,那么就是2段,0-500ms和501-1000ms。那么就会两个值进行存储统计请求量,比如数组[0,1] 各存储一个段的请求值。

(3)计算器算法是滑动窗口算法将时间段划分为1的特殊情况。

  综上我们对滑动窗口算法下个定义:滑动窗口算法是将时间周期分为N个小周期,分别记录每个小周期内访问次数,并且根据时间滑动删除过期的小周期。

三、滑动窗口算法实现

       我们看一段代码:

/**
* 滑动时间窗口限流实现
* 假设某个服务最多只能每秒钟处理100个请求,我们可以设置一个1秒钟的滑动时间窗口,
* 窗口中有10个格子,每个格子100毫秒,每100毫秒移动一次,每次移动都需要记录当前服务请求的次数 
*/
public class SlidingTimeWindow {
    // 时间窗口内最大请求数
    public final int limit = 100; 
    // 服务访问次数
    Long counter = 0L;
    // 使用LinkedList来记录滑动窗口的10个格子。
    LinkedList<Long> slots = new LinkedList<Long>();
    // 时间划分多少段落
    int split = 10;
    // 是否限流了,true:限流了,false:允许正常访问。
    boolean isLimit = false;

    private void doCheck() throws InterruptedException {
        while (true) {
            slots.addLast(counter);
            if (slots.size() > split) {
                slots.removeFirst();// 超出了,就把第一个移出。
            }

            // 比较最后一个和第一个,两者相差100以上就限流
            if ((slots.peekLast() - slots.peekFirst()) > limit) {
                System.out.println("限流了。。");
                // 修改限流标记为true
                isLimit = true;
            } else {
                // 修改限流标记为false
                isLimit = false;
            }
            Thread.sleep(1000/split);
        }
    }

    /**
     * 测试
     * @param args
     * @throws InterruptedException 
     */
    public static void main(String[] args) throws InterruptedException {
        SlidingTimeWindow timeWindow = new SlidingTimeWindow();
        //开启一个线程判断当前的限流情况.
        new Thread(new Runnable() {
            @Override
            public void run() {
                try {
                    timeWindow.doCheck();
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        }).start();


        //模拟请求.
        while(true) {
            //判断是否被限流了.
            if(!timeWindow.isLimit) {
                timeWindow.counter++;
                //未被限流执行相应的业务方法.
                //  executeBusinessCode();
                //模拟业务执行方法时间.
                Thread.sleep(new Random().nextInt(15));
                System.out.println("业务方法执行完了...");
            }else {
                System.out.println("被限流了,直接返回给用户");
            }
        }
    }
}

说明:

(1)doCheck方法,就是改变是否限流标志位的方法:这里通过LinkedList(链表)来进行模拟,通过LinkedList的大小来控制1秒分隔多少段。peekLast()、slots.peekFirst()就是这个时间窗口的一个流量值。

(2)在main方法中,我们通过开启一个线程来执行我们的doCheck()方法,由于doCheck()方法是while(true),所以会一直执行,sleep的时间刚好是每个时间间隔值,那么就会不断刷新LinkedList中的值。

(3)最后while(true)代码是模拟业务执行调用代码,也就是controller发起调用的代码了。

四、小结:

(1)滑动窗口算法是将时间周期分为N个小周期,分别记录每个小周期内访问次数,并且根据时间滑动删除过期的小周期。

(2)计算器算法也属于滑动窗口算法,是滑动窗口算法的一种情况(划分周期为1)。

(3)滑动窗口算法实现方式:数组(多少周期,数组大小就是多大,将每个时间通过一定的算法落到每个数组下标即可);链表(通过链表中的大小来判断划分周期个数,如果超过了,可以使用链表的removeFirst()移除第一个,从而实现往后移动窗口)

(4)数组实现的实例:这个可以看Sentinel的源码,就是定义了一个数组来实现的,时间划分是2。

五、小思考       

当在系统刚刚启动的时候,系统很多资源都未分配完成,瞬间来了n个请求,如果使用滑动窗口算法的话,那么只有达到了QPS控制阈值,才会触发限流机制,那么这样针对系统刚启动资源未分配的情况,就无法防止系统瘫痪了。

针对上面的这种情况,那么你有什么对应的限流算法可以应对呐?

原文地址:https://www.cnblogs.com/mjtabu/p/12603133.html