哈希技术

1、一致性哈希。在分布式系统用途广泛。

2、局部敏感哈希LSH:simhash和minhash。可以用于相似度检测等。谷歌有篇文章利用LSH进行网页去重。

3、布隆过滤器。判断一个元素是否在一个集合中。

4、在数据流算法中哈希算法应用更是广泛。比如数据流中独立元素计数等。

5、特征哈希。近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量。这里可以对minhash进行改进,比如b-bit minhash。

原文地址:https://www.cnblogs.com/fwwdn/p/4525808.html