题目
原文:
Write code to remove duplicates from an unsorted linked list.
FOLLOW UP
How would you solve this problem if a temporary buffer is not allowed?
译文:
从一个未排序的链表中移除重复的项
进一步地,
如果不允许使用临时的缓存,你如何解决这个问题?
解答
如果可以使用额外的存储空间,我们就开一个数组来保存一个元素的出现情况。 对于这种情况,最好的解决方法当然是使用哈希表,但令人非常不爽的是C++标准里是没有 哈希表的(java里有)。网上有人用ext下的hash_map,但毕竟不是C++标准里的, 用起来怪怪的,搞不好换个环境就跑不起来了(像Linux和Windows下使用就不一样)。 所以,一般用一个数组模拟一下就好了。但,这里要注意一个问题, 就是元素的边界,比如链表里存储的是int型变量。那么,如果有负值,这个方法就不奏效 了。而如果元素里的最大值非常大,那么这个数组也要开得很大,而数组中大部分空间是用 不上的,会造成空间的大量浪费。
简言之,如果可以用哈希表,还是用哈希表靠谱。
如下代码遍历一遍链表即可,如果某个元素在数组里记录的是已经出现过, 那么将该元素删除。时间复杂度O(n):
package cha2; import java.util.ArrayList; import java.util.List; public class B021 { public static <T> void rmDuplicate(List<T> list) { for (int i=0; i<list.size(); i++) { for (int j=list.size()-1; j>i; j--) { if (list.get(i).equals(list.get(j))) { list.remove(j); } } } } public static void main(String[] args) { List<Integer> list = new ArrayList<Integer>(); list.add(2); list.add(3); list.add(4); list.add(2); list.add(2); list.add(2); list.add(3); list.add(2); list.add(2); rmDuplicate(list); for (int i : list) System.out.println(i); } }
1、如果可以使用缓存,用哈希表最快
2、如果不能使用缓存,两重循环,内层循环从后向前遍历。