使用
用来做大数据去重的。并且占用空间小。
原理
有一个全为0的byte数组 array。
把一个字符串a,使用hash算法,变成一个整数g,然后把array【g】位置的数变为1,代表这个数据出现过。
下次判断字符串a是否存在,就判断array【g】位置是否为1 。为1就存在,为0 就不存在。
优点
省空间
缺点
存在误判率。计算耗性能。
用来做大数据去重的。并且占用空间小。
有一个全为0的byte数组 array。
把一个字符串a,使用hash算法,变成一个整数g,然后把array【g】位置的数变为1,代表这个数据出现过。
下次判断字符串a是否存在,就判断array【g】位置是否为1 。为1就存在,为0 就不存在。
省空间
存在误判率。计算耗性能。