-List ，set

From:http://pengcqu.iteye.com/blog/502676

package www.changxing.text;

import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.LinkedList;
import java.util.List;
import java.util.Random;

/**
* Tsest
*/
public class Tsest {
    public static final int N = 50000;

    public static List<Integer> values;
    static {
        Integer vals[] = new Integer[N];
        Random r = new Random();
        int currval = 0;
        for (int i = 0; i < N; i++) {
            vals[i] = new Integer(currval);
            currval += r.nextInt(100) + 1;
        }
        values = Arrays.asList(vals);
    }

    /**
     * @param lst
     * @return
     */
    static long timeList(List<Integer> lst) {
        long start = System.currentTimeMillis();
        for (int i = 0; i < N; i++) {
            //return index of values.get(i)
            int index = Collections.binarySearch(lst, values.get(i));
            if (index != i) {
                System.out.println("---error---");
            }
        }
        return System.currentTimeMillis() - start;
    }

    /**
     * Tsest
     *
     * @param args
     */
    public static void main(String args[]) {
        System.out.println("ArrayList消耗时间：" + timeList(new ArrayList<Integer>(values)));
        System.out.println("LinkedList消耗时间：" + timeList(new LinkedList<Integer>(values)));
    }
}

得到的输出是：ArrayList消耗时间：20
LinkedList消耗时间：5075
这个结果不是固定的，但是基本上ArrayList的时间要明显小于LinkedList的时间。因此在这种情况下不宜用LinkedList。二分查找法使用的随机访问(random access)策略，而LinkedList是不支持快速的随机访问的。对一个LinkedList做随机访问所消耗的时间与这个list的大小是成比例的。而相应的，在ArrayList中进行随机访问所消耗的时间是固定的。
这是否表明ArrayList总是比LinkedList性能要好呢？这并不一定，在某些情况下LinkedList的表现要优于ArrayList，有些算法在LinkedList中实现时效率更高。比方说，利用Collections.reverse方法对列表进行反转时，其性能就要好些。
看这样一个例子，加入我们有一个列表，要对其进行大量的插入和删除操作，在这种情况下LinkedList就是一个较好的选择。请看如下一个极端的例子，我们重复的在一个列表的开端插入一个元素：

public class ListDemo {
static final int N=50000;
static long timeList(List list){
long start=System.currentTimeMillis();
Object o = new Object();
for(int i=0;i<N;i++)
list.add(0, o);
return System.currentTimeMillis()-start;
}
public static void main(String[] args) {
System.out.println("ArrayList耗时："+timeList(new ArrayList()));
System.out.println("LinkedList耗时："+timeList(new LinkedList()));
}
}

这时我的输出结果是：ArrayList耗时：2463
LinkedList耗时：15
这和前面一个例子的结果截然相反，当一个元素被加到ArrayList的最开端时，所有已经存在的元素都会后移，这就意味着数据移动和复制上的开销。相反的，将一个元素加到LinkedList的最开端只是简单的未这个元素分配一个记录，然后调整两个连接。在LinkedList的开端增加一个元素的开销是固定的，而在ArrayList的开端增加一个元素的开销是与ArrayList的大小成比例的。

二．空间复杂度
在LinkedList中有一个私有的内部类，定义如下：

private static class Entry {
Object element;
Entry next;
Entry previous;
}

private static class Entry { 
         Object element; 
         Entry next; 
         Entry previous; 
     }

每个Entry对象reference列表中的一个元素，同时还有在LinkedList中它的上一个元素和下一个元素。一个有1000个元素的LinkedList对象将有1000个链接在一起的Entry对象，每个对象都对应于列表中的一个元素。这样的话，在一个LinkedList结构中将有一个很大的空间开销，因为它要存储这1000个Entity对象的相关信息。
ArrayList使用一个内置的数组来存储元素，这个数组的起始容量是10.当数组需要增长时，新的容量按如下公式获得：新容量=(旧容量*3)/2+1，也就是说每一次容量大概会增长50%。这就意味着，如果你有一个包含大量元素的ArrayList对象，那么最终将有很大的空间会被浪费掉，这个浪费是由ArrayList的工作方式本身造成的。如果没有足够的空间来存放新的元素，数组将不得不被重新进行分配以便能够增加新的元素。对数组进行重新分配，将会导致性能急剧下降。如果我们知道一个ArrayList将会有多少个元素，我们可以通过构造方法来指定容量。我们还可以通过trimToSize方法在ArrayList分配完毕之后去掉浪费掉的空间。

三．总结
ArrayList和LinkedList在性能上各有优缺点，都有各自所适用的地方，总的说来可以描述如下：
1．对ArrayList和LinkedList而言，在列表末尾增加一个元素所花的开销都是固定的。对ArrayList而言，主要是在内部数组中增加一项，指向所添加的元素，偶尔可能会导致对数组重新进行分配；而对LinkedList而言，这个开销是统一的，分配一个内部Entry对象。
2．在ArrayList的中间插入或删除一个元素意味着这个列表中剩余的元素都会被移动；而在LinkedList的中间插入或删除一个元素的开销是固定的。
3．LinkedList不支持高效的随机元素访问。
4．ArrayList的空间浪费主要体现在在list列表的结尾预留一定的容量空间，而LinkedList的空间花费则体现在它的每一个元素都需要消耗相当的空间

可以这样说：当操作是在一列数据的后面添加数据而不是在前面或中间,并且需要随机地访问其中的元素时,使用ArrayList会提供比较好的性能；当你的操作是在一列数据的前面或中间添加或删除数据,并且按照顺序访问其中的元素时,就应该使用LinkedList了。

-----------------

http://jingyan.baidu.com/article/5bbb5a1b1f4c7613eba1790d.html

List和Set都是接口。他们各自有自己的实现类，有无顺序的实现类，也有有顺序的实现类。
最大的不同就是List是可以重复的。而Set是不能重复的。
List适合经常追加数据，插入，删除数据。但随即取数效率比较低。
Set适合经常地随即储存，插入，删除。但是在遍历时效率比较低。

---------------------------------------------------

Java的集合类都位于java.util包中，Java集合中存放的是对象的引用，而非对象本身。

Java集合主要分为三种类型：
a.Set（集）：集合中的对象不按特定方式排序，并且没有重复对象。它的有些实现类能对集合中的对象按特定方式排序。
b.List（列表）：集合中的对象按索引位置排序，可以有重复对象，允许按照对象在集合中的索引位置检索对象。
c.Map（映射）：集合中的每一个元素包含一对键对象和值对象，集合中没有重复的键对象，值对象可以重复。它的有些实现类能对集合中的键对象进行排序。

Set、List和Map统称为Java集合。

1.Set(集)
Set集合中的对象不按特定方式排序，并且没有重复对象。Set接口主要有两个实现类HashSet和TreeSet。HashSet类按照哈希算法来存取集合中的对象，存取速度比较快。HashSet类还有一个子类LinkedHashSet类，它不仅实现了哈希算法，而且实现了链表数据结构。TreeSet类实现了SortedSet接口，具有排序功能。

Set的add()方法判断对象是否已经存在于集合中的判断流程：
boolean isExists = false;
Iterator it = set.iterator();
while(it.hasNext()){
Object object = it.next();
if(newObject.equals(oldObject)){
isExists = true;
break;
}
}

2.HashSet类
当HashSet向集合中加入一个对象时，会调用对象的hashCode()方法获得哈希码，然后根据这个哈希码进一步计算出对象在集合中的存放位置。

当Object1变量和object2变量实际上引用了同一个对象，那么object1和object2的哈希码肯定相同。

为了保证HashSet能正常工作，要求当两个对象用equals()方法比较的结果为相等时，它们的哈希码也相等。即：
customer1.hashCode() == customer2.hashCode();

如：对应于Customer类的以下重写后的equals()方法：

public boolean equals(Object o){
if(this==o) return true;
if(!o instanceof Customer) return false;
final Customer other = (Customer)o;
if(this.name.equals(other.getName())&&this.age==other.getAge())
return true;
else
return false;
}

为了保证HashSet正常工作，如果Customer类覆盖了equals()方法，也应该覆盖hashCode()方法，并且保证两个相等的Customer对象的哈希码也一样。

public int hashCode(){
int result;
result = (name==null?0:name.hashCode());
result = 29*result+(age==null?0:age.hashCode());
return result;
}

3.TreeSet类

TreeSet类实现了SortedSet接口，能够对集合中的对象进行排序。TreeSet支持两种排序方式：自然排序和客户化排序，在默认情况下TreeSet采用自然排序方式。

a.自然排序
在JDK中，有一部分类实现了Comparable接口，如Integer、Double和String等。Comparable接口有一个compareTo(Object o)方法，它返回整数类型。对于表达式x.compareTo(y)，如果返回值为0，表示x和y相等，如果返回值大于0，表示x大于y，如果返回值小于0，表示x小于y。

TreeSet调用对象的compareTo()方法比较集合中对象的大小，然后进行升序排列，这种排序方式称为自然排序。

以下列出了JDK中实现了Comparable接口的一些类的排序方式
类排序
BigDecimalBigIntegerByteDoubleFloatIntegerLongShort 按数字大小排序
Character 按字符的Unicode值的数字大小排序
String 按字符串中字符的Unicode值排序

使用自然排序时，只能向TreeSet集合中加入同类型的对象，并且这些对象的类必须实现了Comparable接口，否则会在第二次调用TreeSet的add()方法时，会抛出ClassCastException异常。

例如：
以下是Customer类的compareTo()方法的一种实现方式：
public int compareTo(Object o){
Customer other = (Customer)o;

//先按照name属性排序
if(this.name.compareTo(other.getName())>0) return 1;
if(this.name.compareTo(other.getName())<0) return -1;

//再按照age属性排序
if(this.age>other.getAge()) return 1;
if(this.age<other.getAge()) return -1;

return 0;
}

为了保证TreeSet能正确地排序，要求Customer类的compareTo()方法与equals()方法按相同的规则比较两个Customer对象是否相等。
因此在Customer类的equals()方法中应该采用相同的比较规则：

public boolean equals(Object o){
if(this==o) return true;
if(!(o instanceof Customer)) return false;
final Customer other = (Customer)o;

if(this.name.equals(other.getName())&&this.age==other.getAge()){
return true;
}else{
return false;
}
}

值得注意的是，对于TreeSet中已经存在的Customer对象，如果修改了它们的属性，TreeSet不会对集合进行重新排序。在实际域模型中，实体类的属性可以被更新，因此不适合通过TreeSet来排序。最适合于排序的是不可变类。

b.客户化排序

除了自然排序，TreeSet还支持客户化排序。java.util.Comparator接口用于指定具体的排序方式，它有个compare(Object object1,Object object2)方法，用于比较两个对象的大小。当表达式compare(x,y)的值大于0，表示x大于y；当compare(x,y)的值小于0，表示x小于y；当compare(x,y)的值等于0，表示x等于y。
例如：如果希望TreeSet仅按照Customer对象的name属性进行降序排列，可以创建一个实现Comparator接口的类CustomerComparator：

public class CustomerComparator implements Comparator{
public int compare(Object o1,Object o2){
Customer c1= (Customer)o1;
Customer c2 = (Customer)o2;

if(c1.getName().compareTo(c2.getName())>0) return -1;
if(c2.getName().compareTo(c2.getName())<0) return 1;

return 0;
}
}

接下来在构造TreeSet的实例时，调用它的TreeSet(Comparator comparator)构造方法：
Set set = new TreeSet(new CustomerComparator());

4.向Set中加入持久化类的对象

例如两个Session实例从数据库加载相同的Order对象，然后往HashSet集合里存放，在默认情况下，Order类的equals()方法比较两个Orer对象的内存地址是否相同，因此order1.equals(order2)==false，所以order1和order2游离对象都加入到HashSet集合中，但实际上order1和order2对应的是ORDERS表中的同一条记录。对于这一问题，有两种解决方案：

(1)在应用程序中，谨慎地把来自于不同Session缓存的游离对象加入到Set集合中，如：
Set orders = new HashSet();
orders.add(order1);
if(!order2.getOrderNumber().equals(order1.getOrderNumber()))
order.add(order2);

(2)在Order类中重新实现equals()和hashCode()方法，按照业务主键比较两个Order对象是否相等。

提示：为了保证HashSet正常工作，要求当一个对象加入到HashSet集合中后，它的哈希码不会发生变化。

5.List（列表）

List的主要特征是其对象以线性方式存储，集合中允许存放重复对象。List接口主要的实现类有LinkedList和ArrayList。LinkedList采用链表数据结构，而ArrayList代表大小可变的数组。List接口还有一个实现类Vector，它的功能和ArrayList比较相似，两者的区别在于Vector类的实现采用了同步机制，而ArrayList没有使用同步机制。

List只能对集合中的对象按索引位置排序，如果希望对List中的对象按其他特定方式排序，可以借助Comparator和Collections类。Collections类是集合API中的辅助类，它提供了操纵集合的各种静态方法，其中sort()方法用于对List中的对象进行排序：
a.sort(List list):对List中的对象进行自然排序。
b.sort(List list,Comparator comparator):对List中的对象进行客户化排序，comparator参数指定排序方式。

如Collections.sort(list);

6.Map(映射)

Map(映射)是一种把键对象和值对象进行映射的集合，它的每一个元素都包含一对键对象和值对象，而值对象仍可以是Map类型，依次类推，这样就形成了多级映射。

Map有两种比较常用的实现：HashMap和TreeMap。HashMap按照哈希算法来存取键对象，有很好的存取性能，为了保证HashMap能正常工作，和HashSet一样，要求当两个键对象通过equals()方法比较为true时，这两个对象的hashCode()方法返回的哈希码也一样。

TreeMap实现了SortedMap接口，能对键对象进行排序。和TreeSet一样，TreeMap也支持自然排序和客户化排序两种方式。

例：创建一个缓存类EntityCache，它能粗略地模仿Session的缓存功能，保证缓存中不会出现两个OID相同的Customer对象或两个OID相同的Order对象，这种惟一性是由键对象的惟一性来保证的。

Key.java:

package mypack;

public class Key{
private Class classType;
private Long id;

public Key(Class classType,Long id){
this.classType = classType;
this.id = id;
}

public Class getClassType(){
return this.classType;
}

public Long getId(){
return this.id;
}

public boolean equals(Object o){
if(this==o) return true;
if(!(o instanceof Key)) return false;
final Key other = (Key)o;
if(classType.equals(other.getClassType())&&id.equals(other.getId()))
return true;
return false;
}

public int hashCode(){
int result;
result = classType.hashCode();
result = 29 * result + id.hashCode();
return result;
}
}

EntityCache.java:

package mypack;
import java.util.*;
public class EntityCache {
private Map entitiesByKey;
public EntityCache() {
entitiesByKey=new HashMap();
}

public void put(BusinessObject entity){
Key key=new Key(entity.getClass(),entity.getId());
entitiesByKey.put(key,entity);
}

public Object get(Class classType,Long id){
Key key=new Key(classType,id);
return entitiesByKey.get(key);
}

public Collection getAllEntities(){
return entitiesByKey.values();
}
public boolean contains(Class classType,Long id){
Key key=new Key(classType,id);
return entitiesByKey.containsKey(key);
}
}