java中List、Map、Set、Collection、Stack、Queue等的使用

java中这几个东西是比较常用的，虽然我用的不多，也正是因为用的不多，所以我一直搞不清楚他们之间的具体用法以及相互之间的关系，现在特单独作为一个东西来总结一下。

本文参考一下资料：

1.《java编程思想》一书第11章

2.http://blog.sina.com.cn/s/blog_a345a8960101k9vx.html

3.http://f51889920.iteye.com/blog/1884810

4.http://blog.csdn.net/speedme/article/details/22398395

5.http://www.tuicool.com/articles/qeEzym

6.http://blog.csdn.net/hguisu/article/details/7644395

在《java编程思想》一书中，这几个东西放到一章里面讲的，是在第11章。分了好多的小节去讲的，看了一会，看的头疼，但是基本上好多东西都可以明白，比较容易梳理。

首先放个图在前面，展示下他们各个集合类之间的关系，如下：

java集合框架的基本接口/类层次结构

java.util.Collection [I]
+--java.util.List [I]
   +--java.util.ArrayList [C]
   +--java.util.LinkedList [C]
   +--java.util.Vector [C]
      +--java.util.Stack [C]
+--java.util.Set [I]
   +--java.util.HashSet [C]
   +--java.util.SortedSet [I]
      +--java.util.TreeSet [C]

java.util.Map [I]
+--java.util.SortedMap [I]
   +--java.util.TreeMap [C]
+--java.util.Hashtable [C]
+--java.util.HashMap [C]
+--java.util.LinkedHashMap [C]
+--java.util.WeakHashMap [C]
 
[I]：接口
[C]：类

那么，为什么要有集合类？

面向对象的语言对事物的体现都是以对象的形式，为了方便对多个对象操作，就要对对象进行存储，集合类就是对多个对象进行存储的一种方式。

数组和集合类有何不同？

最主要的区别是长度可变不可变问题。数组可以存储对象，但是长度是固定的，不可变的。集合长度是可变的。其次，数组中可以存储基本数据类型，集合只能存储对象。集合的一个比较大的优点是可以存储不同类型的对象。数组不可以。

下面就开始各种总结。

Collection接口

Collection接口是最基本的集合接口，代表一组Object集合，这些Object被称作Collection的元素，所有实现Collection接口的类型必须提供两个标准的构造函数：无参数的构造函数用于创建一个空的Collection，有一个Collection参数的构造函数用于创建一个新的Collection，这个新的Collection与传入的Collection有相同的元素后一个构造函数允许用户复制一个Collection。这些都比较容易理解。

1 Collection<Integer> ci = new ArrayList<Integer>();
2 Collection<Integer> ci2 = new ArrayList<Integer>(Arrays.asList(1,2,3,4,5));

并且注意Collection中没有get()方法，要想查看或者操作Collection中的元素只能遍历，使用的是iterator()方法，使用该方法可以逐一访问Collection的每一个元素。

1 Iterator it = collection.iterator();//获得迭代
2 while(it.hasNext()){
3       Object obj = it.next();//得到下一个元素    
4 }

由上图可知，Collection分为Lst接口和Set接口。

List接口

　　List接口是有序的Collection，使用该接口能精确控制每个元素的插入位置，可以使用索引来访问List中的元素，跟数组是很类似的。并且List中允许有重复元素，当然有些List的实现类不允许重复元素的存在。

　　List中有iterator()方法，还有listIterator方法，返回一个ListIterator接口，这个接口比标准的Iterator接口相比，多了一些add之类的方法，允许添加、删除、设置元素值以及向前或者向后遍历等。

　　如上图，List下有几个常用类:LinkedList、ArrayList和Vector以及Stack。

　　（1）ArrayList类：实现了可变大小的数组。它允许包含所有元素，包括null。每个ArrayList实例都有一个容量，即用于存储元素的数组的大小，这个容量可以随着不断添加新元素而自动增加，但增长算法没有定义，当插入大量元素时，插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

　（2）LinkedList类：允许null元素，提供额外的get，remove和insert方法，这使得LinkedList可以用作stack、queue或双向队列。它可以再List的中间插入和移除，在这方面比ArrayList有效，但是在随机访问方面就没有ArrayList有效了。如果多个线程同时访问一个List，则必须自己实现访问同步，一种解决方法是在创建List时构造一个同步的List：

List list = Collection.synchronizedList(new LinkedList(……))；

　　（3）Vector类：Vector跟ArrayList非常类似，但是Vector是同步的，由Vector创建的Iterator，虽然和ArrayList创建的 Iterator是同一接口，但是，因为Vector是同步的，当一个Iterator被创建而且正在被使用，另一个线程改变了Vector的状态（例如，添加或删除了一些元素），这时调用Iterator的方法时将抛出ConcurrentModificationException，因此必须捕获该异常。

　　（4）Stack类：继承自Vector，实现一个后进先出的栈。提供了几个基本方法，push、pop、peak、empty、search等。

总结：

List：元素是有序的，元素可以重复。因为该集合体系有索引。
- ArrayList：底层的数据结构使用的是数据结构。
- - 查询速度很快。
  - 增删稍慢。
  - 线程不同步。
  - 默认长度为10增长率为50%。
- LinkedList：底层使用的链表数据结构。
- - 增删速度很快。
  - 查询稍慢。
- Vector：底层是数组数据结构。1.0出现
- - 线程同步
  - 被ArrayList替代了。
  - 长度增长率100%。

Set接口

Set接口是继承自Collection的，它不能包含有重复元素。Set中最多有一个null元素。

因为Set的这个制约，在使用Set集合的时候，应该注意：

1，为Set集合里的元素的实现类实现一个有效的equals(Object)方法。

2，对Set的构造函数，传入的Collection参数不能包含重复的元素。

Set下有几个set类，HashSet、SortedSet、TreeSet，用的较多的是HashSet，其他两种基本不常用，以后慢慢补充该方面知识，下面说HashSet。

　　（1）HashSet，底层数据结构式哈希表，由哈希表支持，不保证集合的迭代顺序，特别是不保证该顺序恒久不变，此类允许使用null元素。HashSet保证元素唯一性的方法是通过元素的两个方法，hashCode和equals来完成。如果元素的HashCode值相同，才会判断equals是否为true。如果元素的hashCode值不同，不会调用equals。

　　（2）TreeSet：底层数据结构式二叉树。注：添加元素必须实现Comparable接口或在实例TreeSet时指定比较器。可以对Set集合中的元素进行排序。保证元素唯一性的依据：compareTo方法return 0；

Map接口

Map集成Collection接口，Map和Collection是两种不同的集合，Collection是值（value）的集合，Map是键值对（key,value）的集合。包含几种主要类和接口：HashMap、LinkedMap、WeakHashMap、SortedMap、TreeMap、HashTable等几种。

　　（1）Hashtable继承Map接口，实现一个key-value映射的哈希表。任何非空（non-null）的对象都可作为key或者value。添加数据使用put(key, value)，取出数据使用get(key)，这两个基本操作的时间开销为常数。

　　（2）WeakHashMap类，WeakHashMap是一种改进的HashMap，它对key实行“弱引用”，如果一个key不再被外部所引用，那么该key可以被GC回收。

总结：

如果涉及到堆栈，队列等操作，应该考虑用List，对于需要快速插入，删除元素，应该使用LinkedList，如果需要快速随机访问元素，应该使用ArrayList。

如果程序在单线程环境中，或者访问仅仅在一个线程中进行，考虑非同步的类，其效率较高，如果多个线程可能同时操作一个类，应该使用同步的类。

在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们的效率更高。

要特别注意对哈希表的操作，作为key的对象要正确复写equals和hashCode方法。

容器类仅能持有对象引用（指向对象的指针），而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内，便损失了该对象的型别信息。

尽量返回接口而非实际的类型，如返回List而非ArrayList，这样如果以后需要将ArrayList换成LinkedList时，客户端代码不用改变。这就是针对抽象编程。

注意：

1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。

2、Set和Collection拥有一模一样的接口。

3、List，可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个，get(0)...。(add/get)

4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) / get(k)，还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。

HashMap会利用对象的hashCode来快速找到key。

6、Map中元素，可以将key序列、value序列单独抽取出来。

使用keySet()抽取key序列，将map中的所有keys生成一个Set。

使用values()抽取value序列，将map中的所有values生成一个Collection。

为什么一个生成Set，一个生成Collection？那是因为，key总是独一无二的，value允许重复。