布隆过滤器(Bloom Filter)

使用

用来做大数据去重的。并且占用空间小。

原理

有一个全为0的byte数组 array。

把一个字符串a,使用hash算法,变成一个整数g,然后把array【g】位置的数变为1,代表这个数据出现过。

下次判断字符串a是否存在,就判断array【g】位置是否为1 。为1就存在,为0 就不存在。

优点

省空间

缺点

存在误判率。计算耗性能。

原文地址:https://www.cnblogs.com/weijiqian/p/14154093.html