Java集合框架总结（2）—

Java集合框架总结（2）——Set接口的使用

1、Set接口的使用

Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档（可见身边随时带上API文档有多重要），基本与Collection方法相同。只是行为不同（Set不允许包含重复元素）。

Set集合不允许重复元素，是因为Set判断两个对象相同不是使用==运算符，而是根据equals方法。即两个对象用equals方法比较返回true，Set就不能接受两个对象。

01
public class TestSet

02
{

03
    public static void main(String[] args)

04
    {

05
        Set<String> books = new HashSet<String>();

06
         
07
        //添加一个字符串对象

08
        books.add(new String("Struts2权威指南"));

09
         
10
        //再次添加一个字符串对象，

11
        //因为两个字符串对象通过equals方法比较相等，所以添加失败，返回false

12
        boolean result = books.add(new String("Struts2权威指南"));

13
         
14
        System.out.println(result);

15
         
16
        //下面输出看到集合只有一个元素

17
        System.out.println(books); 

18
    }

19
}

程序运行结果：

false
[Struts2权威指南]

说明：程序中，book集合两次添加的字符串对象明显不是一个对象（程序通过new关键字来创建字符串对象），当使用==运算符判断返回false，使用equals方法比较返回true，所以不能添加到Set集合中，最后只能输出一个元素。

Set接口中的知识，同时也适用于HashSet、TreeSet和EnumSet三个实现类。

2、HashSet类

HashSet按Hash算法来存储集合的元素，因此具有很好的存取和查找性能。

HashSet的特点：

（1）HashSet不是同步的，多个线程访问是需要通过代码保证同步

（2）集合元素值可以使null。

HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等，并且两个对象的hashCode（）方法返回值也相等。

01
//类A的equals方法总是返回true,但没有重写其hashCode()方法

02
class A

03
{

04
    public boolean equals(Object obj)

05
    {

06
        return true;

07
    }

08
}

09
//类B的hashCode()方法总是返回1,但没有重写其equals()方法

10
class B

11
{

12
    public int hashCode()

13
    {

14
        return 1;

15
    }

16
}

17
//类C的hashCode()方法总是返回2,并重写其equals()方法

18
class C

19
{

20
    public int hashCode()

21
    {

22
        return 2;

23
    }

24
    public boolean equals(Object obj)

25
    {

26
        return true;

27
    }

28
}

29
public class TestHashSet

30
{

31
    public static void main(String[] args)

32
    {

33
        HashSet<Object> books = new HashSet<Object>();

34
        //分别向books集合中添加2个A对象，2个B对象，2个C对象

35
        books.add(new A());

36
        books.add(new A());

37
        books.add(new B());

38
        books.add(new B());

39
        books.add(new C());

40
        books.add(new C());

41
        System.out.println(books);

42
    }

43
}

程序运行结果：
[B@1 , B @1 , C@2 , A@b5dac4 , A@9945ce]

说明：

（1）Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数）值，所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。

（2）即使2个A对象通过equals比较返回true，但HashSet依然把它们当成2个对象；即使2个B对象的hashCode（）返回相同值，但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时，如果重写该对象equals（）方法，也应该重写其hashCode（）方法。其规则是：如果2个对象通过equals方法比较返回true时，这两个对象的hashCode也应该相同。

hash算法的功能：

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度，它可以保证查询得到快速执行。

当需要查询集合中某个元素时，hash算法可以直接根据该元素的值得到该元素保存位置，从而可以让程序快速找到该元素。

当从HashSet中访问元素时，HashSet先计算该元素的hashCode值（也就是调用该对象的hashCode（））方法的返回值），然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位（slot）”通常称为“桶（bucket）”，如果多个元素的hashCode相同，但它们通过equals（）方法比较返回false，就需要一个“桶”里放多个元素，从而导致性能下降。

继续深入研究HashSet：

当向HashSet中添加一个可变对象后，并且后面程序修改了该可变对象的属性，可能导致它与集合中其他元素相同，这就可能导致HashSet中包含两个相同的对象。

看下面程序：

01
class R

02
{

03
    int count;

04
    public R(int count)

05
    {

06
        this.count = count;

07
    }

08
    public String toString()

09
    {

10
        return "R(count属性:" + count + ")";

11
    }

12
    public boolean equals(Object obj)

13
    {

14
        if (obj instanceof R)

15
        {

16
            R r = (R)obj;

17
            if (r.count == this.count)

18
            {

19
                return true;

20
            }

21
        }

22
        return false;

23
    }

24
    public int hashCode()

25
    {

26
        return this.count;

27
    }

28
}

29
public class TestHashSet2

30
{

31
    public static void main(String[] args)

32
    {

33
        HashSet<R> hs = new HashSet<R>();

34
        hs.add(new R(5));

35
        hs.add(new R(-3));

36
        hs.add(new R(9));

37
        hs.add(new R(-2));

38
        //打印HashSet集合，集合元素是有序排列的

39
        System.out.println(hs);

40
        //取出第一个元素

41
        Iterator<R> it = hs.iterator();

42
        R first = (R)it.next();     //first指向集合的第一个元素

43
        //为第一个元素的count属性赋值

44
        first.count = -3;           //first指向的元素值发生改变，地址并没有改变，大家可以试着用Java内存分配机制（栈和堆)思考下。

45
        //再次输出count将看到HashSet里的元素处于无序状态

46
        System.out.println(hs);

47
        hs.remove(new R(-3));

48
        System.out.println(hs);

49
        //输出false

50
        System.out.println("hs是否包含count为-3的R对象？" + hs.contains(new R(-3)));

51
        //输出false

52
        System.out.println("hs是否包含count为5的R对象？" + hs.contains(new R(5)));

53
 
54
    }

55
}

程序运行结果：

[R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)]
[R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)]
[R(count属性:-3), R(count属性:9), R(count属性:-2)]
hs是否包含count为-3的R对象？false
hs是否包含count为5的R对象？false

说明：程序重写了R类的equals（）和hashCode（）方法，这两个方法都是根据R对象的count属性来判断。从运行结果可以看出，HashSet集合中有完全相同元素，这表明两个元素已经重复，但因为HashSet在添加它们时已经把它们添加到了不同地方，所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象，它保存在count为5的R对象对应的位置（地址）。当向HashSet中添加可变对象时，必须十分小心。如果修改HashSet集合中的对象，有可能导致该对象与集合中其他对象相等，从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet，LinkedHashSet集合也根据元素hashCode值来决定元素存储位置，但它同时使用链表维护元素的次序，即当遍历LinkedHashSet集合元素时，HashSet将会按元素的添加顺序来访问集合里的元素。

3、TreeSet类

TreeSet是SortedSet接口的唯一实现，TreeSet可以确保集合元素处于排序状态（元素是有序的）。

TreeSet提供的几个额外方法：

Comparator comparator()：返回当前Set使用的Comparator，或者返回null，表示以自然方式排序。

Object first()：返回集合中的第一个元素。

Object last()：返回集合中的最后一个元素。

Objiect lower(Object e)：返回集合中位于指定元素之前的元素（即小于指定元素的最大元素，参考元素可以不是TreeSet的元素）。

Object higher(Object e)：返回集合中位于指定元素之后的元素（即大于指定元素的最小元素，参考元素可以不需要TreeSet的元素）。

SortedSet subSet(fromElement， toElement)：返回此Set的子集，范围从fromElement(包含大于等于）到toElement(不包含小于）。

SortedSet headSet(toElement)：返回此Set的子集，由小于toElement的元素组成。

SortedSet tailSet(fromElement)：返回此Set的子集，由大于或等于fromElement的元素组成。

view source

print ?

01 public class TestTreeSetCommon

02 {

03     public static void main(String[] args)

04     {

05         TreeSet<Integer> nums = new TreeSet<Integer>();

06         //向TreeSet中添加四个Integer对象

07         nums.add(5);

08         nums.add(2);

09         nums.add(10);

10         nums.add(-9);

11         //输出集合元素，看到集合元素已经处于排序状态

12         System.out.println(nums);

13         //输出集合里的第一个元素

14         System.out.println(nums.first());

15         //输出集合里的最后一个元素

16         System.out.println(nums.last());

17         //返回小于4的子集，不包含4

18         System.out.println(nums.headSet(4));

19         //返回大于5的子集，如果Set中包含5，子集中还包含5

20         System.out.println(nums.tailSet(5));

21         //返回大于等于-3，小于4的子集。

22         System.out.println(nums.subSet(-3 , 4));

23     }

24 }

程序运行结果：

[-9, 2, 5, 10]
-9
10
[-9, 2]
[5, 10]
[2]