Cracking the coding interview--Q2.1

题目

原文：

Write code to remove duplicates from an unsorted linked list.

FOLLOW UP

How would you solve this problem if a temporary buffer is not allowed?

译文：

从一个未排序的链表中移除重复的项

进一步地，

如果不允许使用临时的缓存，你如何解决这个问题？

解答

如果可以使用额外的存储空间，我们就开一个数组来保存一个元素的出现情况。对于这种情况，最好的解决方法当然是使用哈希表，但令人非常不爽的是C++标准里是没有哈希表的(java里有)。网上有人用ext下的hash_map，但毕竟不是C++标准里的，用起来怪怪的，搞不好换个环境就跑不起来了(像Linux和Windows下使用就不一样)。所以，一般用一个数组模拟一下就好了。但，这里要注意一个问题，就是元素的边界，比如链表里存储的是int型变量。那么，如果有负值，这个方法就不奏效了。而如果元素里的最大值非常大，那么这个数组也要开得很大，而数组中大部分空间是用不上的，会造成空间的大量浪费。

简言之，如果可以用哈希表，还是用哈希表靠谱。

如下代码遍历一遍链表即可，如果某个元素在数组里记录的是已经出现过，那么将该元素删除。时间复杂度O(n):

package cha2;

import java.util.ArrayList;
import java.util.List;

public class B021 {
    
    public static <T> void rmDuplicate(List<T> list) {
        for (int i=0; i<list.size(); i++) {
            for (int j=list.size()-1; j>i; j--) {
                if (list.get(i).equals(list.get(j))) {
                    list.remove(j);
                }
            }
        }
    }
    
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>();
        list.add(2);
        list.add(3);
        list.add(4);
        list.add(2);
        list.add(2);
        list.add(2);
        list.add(3);
        list.add(2);
        list.add(2);
        rmDuplicate(list);
        for (int i : list)
            System.out.println(i);
    }
}

1、如果可以使用缓存，用哈希表最快

2、如果不能使用缓存，两重循环，内层循环从后向前遍历。