一道算法题

1.有1千万条有城府的短信,以文本文件的形式保存,一行一条,也有重复,请用5分钟时间找出重复出现最多的前10条。

(1)使用哈希表方法

将1千万条短信分成若干组,进行边扫描边建立散列表的方法。

第一次扫描:取首字节+尾字节+中间任意两字节作为HashCode,插入到hashtable中;并记录其地址、信息长度和重复次数。

原文地址:https://www.cnblogs.com/mengyan/p/2674144.html