布隆过滤器

布隆过滤器

关于缓存穿透的解决方案，这篇文章讲的很透彻，拿来分享下：

详细内容参考博主链接：

https://www.cnblogs.com/rjzheng/p/8908073.html

布隆过滤器

1、原理

布隆过滤器的巨大用处就是，能够迅速判断一个元素是否在一个集合中。因此他有如下三个使用场景:

网页爬虫对URL的去重，避免爬取相同的URL地址
反垃圾邮件，从数十亿个垃圾邮件列表中判断某邮箱是否垃圾邮箱（同理，垃圾短信）
缓存击穿，将已存在的缓存放到布隆过滤器中，当黑客访问不存在的缓存时迅速返回避免缓存及DB挂掉。

OK，接下来我们来谈谈布隆过滤器的原理
其内部维护一个全为0的bit数组，需要说明的是，布隆过滤器有一个误判率的概念，误判率越低，则数组越长，所占空间越大。误判率越高则数组越小，所占的空间越小。

假设，根据误判率，我们生成一个10位的bit数组，以及2个hash函数（ $f_{1}, f_{2}$

$f_{1}, f_{2}$

$f_{1}, f_{2}$

假设输入集合为( $N_{1}, N_{2}$

同理，经过计算 $f_{1} (N_{2})$

这个时候，我们有第三个数 $N_{3}$

$N_{3}$

若值恰巧都位于上图的红色位置中，我们则认为， $N_{3}$
若值有一个不位于上图的红色位置中，我们则认为， $N_{3}$

以上就是布隆过滤器的计算原理

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/fengli9998/p/8939658.html