布隆过滤器

1.由很多的随机映射函数,和一个二进制向量(由0和1组成)构成

2.先存储:

  1)通过散列函数通过计算将之放进二进制向量(将指定位置的0变成1)中

3.查找:

  2)通过散列函数通过计算其位置看是否都是1来判断是否在数据集合中 

4.优势:

  1)不保存数据的内容,

  2)只通过随机映射函数来保存信息(指纹)

  3)信息安全性高,获取到了二进制向量和散列函数也无法推断出数据内容

5.缺点:

  1)存在误判

  2)数据删除困难

6.应用场景:用来判断访问数据是否在大量现有数据中

7.现有框架:guava,1.9以上实现了

  1)put方法

      使用哈希算法将之放进二进制向量中

  2)mightContain

      判断是否在里面

  3)create

      创建布隆过滤器

原文地址:https://www.cnblogs.com/nyhhd/p/12570845.html