一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL

题目:一个大的含有50M个URL的记录,一个小的含有500个URL的记录,找出两个记录里相同的URL。

第1种方法

首先使用包含500个url的文件创建一个hash_set。
然后遍历50M的url记录,如果url在hash_set中,则输出此url并从hash_set中删除这个url。
所有输出的url就是两个记录里相同的url。

第2种方法

AC自动机

原文地址:https://www.cnblogs.com/dartagnan/p/2196640.html