collection set

http://blog.csdn.net/humingfiy/article/details/7946408

Collection：List、Set
Map：HashMap、HashTable

如何在它们之间选择

一、Array ，Arrays

Java所有“存储及随机访问一连串对象”的做法，array是最有效率的一种。

1、
效率高，但容量固定且无法动态改变。
array还有一个缺点是，无法判断其中实际存有多少元素，length只是告诉我们array的容量。

2、Java中有一个Arrays类，专门用来操作array。
arrays中拥有一组static函数，
equals()：比较两个array是否相等。array拥有相同元素个数，且所有对应元素两两相等。
fill()：将值填入array中。
sort()：用来对array进行排序。
binarySearch()：在排好序的array中寻找元素。
System.arraycopy()：array的复制。

二、Collection ，Map

若撰写程序时不知道究竟需要多少对象，需要在空间不足时自动扩增容量，则需要使用容器类库，array不适用。

1、Collection 和 Map的区别

容器内每个为之所存储的元素个数不同。
Collection类型者，每个位置只有一个元素。
Map类型者，持有 key-value pair，像个小型数据库。

2、各自旗下的子类关系

Collection
     --List：将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
           --ArrayList / LinkedList / Vector
      --Set ：不能含有重复的元素
           --HashSet / TreeSet
Map
      --HashMap
      --HashTable
      --TreeMap

3、其他特征

*    List，Set，Map将持有对象一律视为Object型别。
*    Collection、List、Set、Map都是接口，不能实例化。
     继承自它们的 ArrayList, Vector, HashTable,HashMap是具象class，这些才可被实例化。
*   vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

三、Collections

Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如，Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list);对list中元素排序

四、如何选择？

1、容器类和Array的区别、择取
* 容器类仅能持有对象引用（指向对象的指针），而不是将对象信息copy一份至数列某位置。
* 一旦将对象置入容器内，便损失了该对象的型别信息。

2、
    *   在各种Lists中，最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时，使用LinkedList()；
      Vector总是比ArrayList慢，所以要尽量避免使用。
    *   在各种Sets中，HashSet通常优于HashTree（插入、查找）。只有当需要产生一个经过排序的序列，才用TreeSet。
      HashTree存在的唯一理由：能够维护其内元素的排序状态。
    *    在各种Maps中
       HashMap用于快速查找。
    *   当元素个数固定，用Array，因为Array效率是最高的。

结论：最常用的是ArrayList，HashSet，HashMap，Array。

注意：

1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List，可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个，get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) /get(k)，还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
     HashMap会利用对象的hashCode来快速找到key。
    *   hashing
        哈希码就是将对象的信息经过一些转变形成一个独一无二的int值，这个值存储在一个array中。
        我们都知道所有存储结构中，array查找速度是最快的。所以，可以加速查找。

        发生碰撞时，让array指向多个values。即，数组每个位置上又生成一个梿表。

6、Map中元素，可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列，将map中的所有keys生成一个Set。
使用values()抽取value序列，将map中的所有values生成一个Collection。

为什么一个生成Set，一个生成Collection？那是因为，key总是独一无二的，value允许重复。

---------------------------------------------------------------------------------------

特别介绍1：HashTableVS HashMap

HashTable的应用非常广泛，HashMap是新框架中用来代替HashTable的类，也就是说建议使用HashMap，不要使用HashTable。

这里简单分析他们的区别。
1.HashTable的方法是同步的，HashMap未经同步，所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样。（最主要的区别）

2.HashTable不允许null值(key和value都不可以),HashMap允许null值(key和value都可以，只容许有一个null值的key，可以有多个null值的value)。

3.HashTable有一个contains(Object value)，功能和containsValue(Object value)功能一样。

4.HashTable使用Enumeration，HashMap使用Iterator。

以上只是表面的不同，它们的实现也有很大的不同。

5.HashTable中hash数组默认大小是11，增加的方式是 old*2+1。HashMap中hash数组的默认大小是16，而且一定是2的指数。

6.哈希值的使用不同，HashTable直接使用对象的hashCode，代码是这样的：
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
而HashMap重新计算hash值，而且用与代替求模：
int hash = hash(k);
int i = indexFor(hash, table.length);

static int hash(Object x) {
　　 int h = x.hashCode();

　　h += ~(h << 9);
　　h ^= (h >>> 14);
　　h += (h << 4);
　　h ^= (h >>> 10);
　　 return h;
}
static int indexFor(int h, int length) {
　　 return h & (length-1);
}
以上只是一些比较突出的区别，当然他们的实现上还是有很多不同的，比如
HashMap对null的操作。

特别介绍2：ArrayList VS Vector VSLinkList

VECTOR是每个操作都同步的，如果你觉得集合中的数据安全性要求很高那就用VECTOR

ARRAYLIST并不是线程安全的，除了这点，跟VECTOR没什么差别，都是通过数组的方式来实现一个集合

LINKLIST跟ARRAYLIST的区别是，LINKLIST是用链表的方式实现的集合，所以在LIST的增、删、迭代等几个操作上，与ARRAYLIST速度有所差别。如果一个LIST需要频繁做删除操作的话应该选择LINKLIST，

ArrayList适合随机访问
LinkedList才是适合顺序访问的链但是其元素的增减比ArrayList高.

特别介绍3：HashSet VSTreeSet

两者区别的形象展示：假设输入值的顺序为：1,4,3,1,用HashSet输出的顺序为：1,4,3(可能)；用TreeSet输出的顺序为：1,3,4(如Windows的文件夹，不能重复，且有顺序)。

HashSet

此类实现 Set 接口，由哈希表（实际上是一个 HashMap实例）支持。它不保证集合的迭代顺序；特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
此类为基本操作提供了稳定性能，这些基本操作包括 add、remove、contains 和size，假定哈希函数将这些元素正确地分布在桶中。对此集合进行迭代所需的时间与 HashSet 实例的大小（元素的数量）和底层HashMap实例（桶的数量）的“容量”的和成比例。因此，如果迭代性能很重要，则不要将初始容量设置得太高（或将加载因子设置得太低）。
注意：HashSet要重写hashCode和equals方法。

我们应该为要存放到散列表的各个对象定义hashCode()和equals();
import java.util.HashSet;
import java.util.Iterator;

public class HashSetTest{
         public static voidmain(String[] args)
        {
                HashSet hs=new HashSet();

                hs.add(new Student(1,"zhangsan"));
                hs.add(new Student(2,"lishi"));
                hs.add(new Student(3,"wangwu"));
                hs.add(new Student(1,"zhangsan"));

                Iterator it=hs.iterator();
                while(it.hasNext())
                {
                        System.out.println(it.next());
                }
        }
}
class Student        //HashSet要重写hashCode和equals方法
{
         int num;
         String name;
         Student(intnum,String name)
        {
                this.num=num;
                this.name=name;
        }
         public StringtoString()
        {
                return "num :"+num+"name:"+name;
        }
         public inthashCode()
        {
                return num*name.hashCode();
        }
         public booleanequals(Object o)
        {
                Student s=(Student)o;
                return num==s.num &&name.equals(s.name);
        }
}

TreeSet
此类实现 Set 接口，该接口由 TreeMap 实例支持。此类保证排序后的 set按照升序排列元素，根据使用的构造方法不同，可能会按照元素的自然顺序进行排序，或按照在创建 set时所提供的比较器进行排序。
是一个有序集合,元素中安升序排序,缺省是按照自然顺序进行排序,意味着TreeSet中元素要实现Comparable接口;
我们可以构造TreeSet对象时,传递实现了Comparator接口的比较器对象.
import java.util.*;

public class TreeSetTest{
         public static voidmain(String[] args)
        {
                //TreeSet ts=new TreeSet();
                TreeSet ts=new TreeSet(new Students.compareToStudent());
                ts.add(new Students(2,"zhangshan"));
                ts.add(new Students(3,"lishi"));
                ts.add(new Students(1,"wangwu"));
                ts.add(new Students(4,"maliu"));

                Iterator it=ts.iterator();
                while(it.hasNext())
                {
                        System.out.println(it.next());
                }
        }

}

class Students implements Comparable
{
         int num;
         String name;
         Students(intnum,String name)
        {
                this.num=num;
                this.name=name;
        }
         static classcompareToStudent implementsComparator        //定义一个内部类来实现比较器
        {
                public int compare(Object o1, Object o2) {
                        Students s1=(Students)o1;
                        Students s2=(Students)o2;
                        int rulst= s1.num > s2.num ? 1 :(s1.num==s2.num ? 0 :-1);
                        if(rulst==0)
                        {
                                rulst=s1.name.compareTo(s2.name);
                        }
                        return rulst;
                }
        }
         public intcompareTo(Objecto)                //写具体的比较方法
        {
                int result;
                Students s=(Students)o;
                result=num >s.num ? 1:(num==s.num ?0 : -1);
                if(result==0)
                {
                        result=name.compareTo(s.name);
                }
                return result;
        }
         public StringtoString()
        {
                return num+":"+name;
        }
}

总结
HashSet是基于Hash算法实现的,其性能通常优于TreeSet,我们通常都应该使用HashSet,在我们需要排序的功能时,我门才使用TreeSet。