Java集合

java集合学习

此篇博客用sout代替System.out.pringln();

Java集合类是一种特别有用的工具类，可以用于存储数量不等的多个对象，并可以实现常用的数据结构，如栈、队列等。除此之外，Java集合还可用于保存具有映射关系的关联数组。Java集合大致可分为Set、List和Map三种体系，其中Set代表无序、不可重复的集合；List代表有序、重复的集合；而Map则代表具有映射关系的集合。从Java 5以后，Java又增加了Queue体系集合，代表一种队列集合实现。

概述

集合类和数组不一样，数组元素既可以是基本类型的值，也可以是对象（实际上保存的是对象的引用变量）；而集合里只能保存对象（实际上只是保存对象的引用变量，但通常习惯上认为集合里保存的是对象）。

Java的集合类主要由两个接口派生而出：Collection和Map，Collection和Map是Java集合框架的根接口，这两个接口又包含了一些子接口或实现类。（PS：图片来源于冰湖一角的博客）

Collection和iterator接口

Collection接口是List、Set和Queue接口的父接口，该接口里定义的方法既可用于操作Set集合，也可用于操作List和Queue集合。Collection接口里定义了如下操作集合元素的方法。以下为快速参考，详见API文档。

boolean add(Object o)//该方法用于向集合里添加一个元素。如果集合对象被添加操作改变了，则返回true。
boolean addAll(Collection c)//该方法把集合c里的所有元素添加到指定集合里。如果集合对象被添加操作改变了，则返回true。
void clear()//清除集合里的所有元素，将集合长度变为0。
boolean contains(Object o)//返回集合里是否包含指定元素。
boolean containsAll(Collection c)//返回集合里是否包含集合c里的所有元素。
boolean isEmpty()//返回集合是否为空。当集合长度为0时返回true，否则返回false。
Iterator iterator()//返回一个Iterator对象，用于遍历集合里的元素。
boolean remove(Object o)//删除集合中的指定元素o，当集合中包含了一个或多个元素o时，这些元素将被删除，该方法将返回true。
boolean removeAll(Collection c)//从集合中删除集合c里包含的所有元素（相当于用调用该方法的集合减集合c），如果删除了一个或一个以上的元素，则该方法返回true。
boolean retainAll(Collection c)//从集合中删除集合c里不包含的元素（相当于把调用该方法的集合变成该集合和集合c的交集），如果该操作改变了调用该方法的集合，则该方法返回true。
int size()//该方法返回集合里元素的个数。
Object[] toArray()//该方法把集合转换成一个数组，所有集合元素变成对应的数组元素。

在普通情况下，当我们把一个对象“丢进”集合中后，集合会忘记这个对象的类型——也就是说，系统把所有的集合元素都当成Object类的实例进行处理。从JDK 1.5以后，这种状态得到了改进：可以使用泛型来限制集合里元素的类型，并让集合记住所有集合元素的类型。

使用Iterator接口遍历元素

Iterator接口隐藏了各种Collection实现类的底层细节，向应用程序提供了遍历Collection集合元素的统一编程接口。Iterator接口里定义了如下三个方法。

boolean hasNext()//如果被迭代的集合元素还没有被遍历，则返回true。
Object next()//返回集合里的下一个元素。
void remove()//删除集合里上一次next方法返回的元素。

eg:

public static void main(){
    Collection books=new HashSet();
    books.add("aaaaa");
    books.add("bbbbb");
    books.add("ccccc");
    Iterator it =books.iterator();
    while(it.hasNext()){
        String book =(String)it.next();//it.next()返回Object需要强转
        System.out.println(book);
        if(book.equals("aaaaa")){
            it.remove();//删除上一次next方法返回的元素
            //下面代码引发异常 iterator迭代过程中不可修改集合元素
            //books.remoce(book);
        }
        book="ceshi";//对book赋值
    }
    System.out.println(books);
}

当使用Iterator对集合元素进行迭代时，Iterator并不是把集合元素本身传给了迭代变量，而是把集合元素的值传给了迭代变量，所以修改迭代变量的值对集合元素本身没有任何影响。

Iterator迭代器采用的是快速失败（fail-fast）机制，一旦在迭代过程中检测到该集合已经被修改（通常是程序中的其他线程修改），程序立即引发ConcurrentModificationException异常，而不是显示修改后的结果，这样可以避免共享资源而引发的潜在问题。

Iterator仅用于遍历集合，Iterator本身并不提供盛装对象的能力。如果需要创建Iterator对象，则必须有一个被迭代的集合。没有集合的Iterator仿佛无本之木，没有存在的价值。

使用foreach遍历元素

与使用Iterator接口迭代访问集合元素类似的是，foreach循环中的迭代变量也不是集合元素本身，系统只是依次把集合元素的值赋给迭代变量，因此在foreach循环中修改迭代变量的值也没有任何实际意义。

同样，当使用foreach循环迭代访问集合元素时，该集合也不能被改变，否则将引发ConcurrentModificationException异常。

Set集合

Set集合与Collection基本上完全一样，它没有提供任何额外的方法。实际上Set就是Collection，只是行为略有不同（Set不允许包含重复元素）。

Set集合不允许包含相同的元素，如果试图把两个相同的元素加入同一个Set集合中，则添加操作失败，add方法返回false，且新元素不会被加入。

Set判断两个对象相同不是使用==运算符，而是根据equals方法。也就是说，只要两个对象用equals方法比较返回true，Set就不会接受这两个对象；反之，只要两个对象用equals方法比较返回false，Set就会接受这两个对象（甚至这两个对象是同一个对象，Set也可把它们当成两个对象处理，在后面程序中可以看到这种极端的情况）。

HashSet类

HashSet是Set接口的典型实现，大多数时候使用Set集合时就是使用这个实现类。HashSet按Hash算法来存储集合中的元素，因此具有很好的存取和查找性能。

特点：

不能保证元素的排列顺序，顺序有可能发生变化
HashSet不是同步的，如果多个线程同时访问一个HashSet，假设有两个或者两个以上线程同时修改了HashSet集合时，则必须通过代码来保证其同步。
集合元素值可以是null。

当向HashSet集合中存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据该HashCode值决定该对象在HashSet中的存储位置。如果有两个元素通过equals()方法比较返回true，但它们的hashCode()方法返回值不相等，HashSet将会把它们存储在不同的位置，依然可以添加成功。

简单地说，HashSet集合判断两个元素相等的标准是两个对象通过equals()方法比较相等，并且两个对象的hashCode()方法返回值也相等。

下面程序分别提供了三个类A、B和C，它们分别重写了equals()、hashCode()两个方法的一个或全部
class A{//类A的equals方法总是返回true；没有重写hashCode方法
    public boolean equals(Object obj){return true;}
}
class B{//类B的hashCode方法总是返回1；没有重写equals方法
    public int hashCode(){return 1;}
}
class C{//类C的hashCode方法总是返回2；且重写equals方法
    public int hashCode(){return 2;}
    public boolean equals(Object obj){return true;}
}
//main
HashSet books=new HashSet();
books.add(new A());
books.add(new A());
books.add(new B());
books.add(new B());
books.add(new C());
books.add(new C());
System.out.println(books);

运行结果：

[b@1,B@1,C@2,A@5438cd,A@9931f5]‘

从上面程序可以看出，即使两个A对象通过equals()方法比较返回true，但HashSet依然把它们当成两个对象；即使两个B对象的hashCode()返回相同值（都是1），但HashSet依然把它们当成两个对象。这里有一个问题需要注意：当把一个对象放入HashSet中时，如果需要重写该对象对应类的equals()方法，则也应该重写其hashCode()方法。其规则是：如果两个对象通过equals()方法比较返回true，这两个对象的hashCode值也应该相同。

如果该对象哈希码与集合已存在对象的哈希码不一致，则该对象没有与其他对象重复，添加到集合中.如果存在于该对象相同的哈希码，那么通过equals方法判断两个哈希码相同的对象是否为同一对象（判断的标准是：属性是否相同）

注意

当把一个对象放入HashSet中时，如果需要重写该对象对应类的equals()方法，则也应该重写其hashCode()方法。其规则是：如果两个对象通过equals()方法比较返回true，这两个对象的hashCode值也应该相同。

如果两个对象通过equals()方法比较返回true，但这两个对象的hashCode()方法返回不同的hashCode值时，这将导致HashSet会把这两个对象保存在Hash表的不同位置，从而使两个对象都可以添加成功，这就与Set集合的规则有些出入了。

如果两个对象的hashCode()方法返回的hashCode值相同，但它们通过equals()方法比较返回false时将更麻烦：因为两个对象的hashCode值相同，HashSet将试图把它们保存在同一个位置，但又不行（否则将只剩下一个对象），所以实际上会在这个位置用链式结构来保存多个对象；而HashSet访问集合元素时也是根据元素的hashCode值来快速定位的，如果HashSet中两个以上的元素具有相同的hashCode值，将会导致性能下降。

所以如果需要把某个类的对象保存到HashSet集合中，重写这个类的equals()方法和hashCode()方法时，应该尽量保证两个对象通过equals()方法比较返回true时，它们的hashCode()方法返回值也相等。

HashSet中每个能存储元素的“槽位”（slot）通常称为“桶”（bucket），如果有多个元素的hashCode值相同，但它们通过equals()方法比较返回false，就需要在一个“桶”里放多个元素，这样会导致性能下降。

重写hashCode()方法的基本规则

在程序运行过程中，同一个对象多次调用hashCode()方法应该返回相同的值。
当两个对象通过equals()方法比较返回true时，这两个对象的hashCode()方法应返回相等的值。
对象中用作equals()方法比较标准的Field，都应该用来计算hashCode值。

重写hashCode()的一般规则

1.首先计算一个int类型的哈希值计算规则：

Boolean	hashCode=(f?0:1)
整数类型(byte short int char)	hashCode=(int)f
long	hashCode=(int)(f^(f>>>32))
float	hashCode=Float.floatToIntBits(f)
double	long l = Double.doubleToLongBits(f); hashCode=(int)(l^(l>>>32))
普通引用类型	hashCode=f.hashCode()

2.计算出来的多个hashCode值组合计算出一个hashCode值返回

return f1.hashCode()+(int)f2;//可能相加产生偶然相等
//为了避免直接相加产生偶然相等，可以通过为各个Field乘以任意一个质数后再相加。
return f1.hashCode()*17+(int)f2*13;

注意

当向HashSet中添加可变对象时，必须十分小心。如果修改HashSet集合中的对象，有可能导致该对象与集合中的其他对象相等，从而导致HashSet无法准确访问该对象。

比如改变了Set集合中第一个对象的count实例变量的值，这将导致该该对象与集合中的其他对象相同。这时的HashSet集合会变得十分混乱。

底层实现

private transient HashMap<E, Object> map;
public HashSet() {
    this.map = new HashMap();
}

由以上源码可见HashSet底层是由HashMap实现的

LinkedHashSet类

HashSet还有一个子类LinkedHashSet，LinkedHashSet集合也是根据元素的hashCode值来决定元素的存储位置，但它同时使用链表维护元素的次序，这样使得元素看起来是以插入的顺序保存的。

也就是说，当遍历LinkedHashSet集合里的元素时，LinkedHashSet将会按元素的添加顺序来访问集合里的元素。LinkedHashSet需要维护元素的插入顺序，因此性能略低于HashSet的性能，但在迭代访问Set里的全部元素时将有很好的性能，因为它以链表来维护内部顺序.

LinkedHashSet books =new LinkedHashSet();
books.add("aaa");
books.add("bbb");
sout(books);
books.remove("aaa");
books.add("aaa");
sout(books);

运行结果如下

["aaa","bbb"]

["bbb","aaa"]

TreeSet

TreeSet是SortedSet接口的实现类，正如SortedSet名字所暗示的，TreeSet可以确保集合元素处于排序状态。与HashSet集合相比，TreeSet还提供了如下几个额外的方法。

Comparator comparator()：如果TreeSet采用了定制排序，则该方法返回定制排序所使用的Comparator；如果TreeSet采用了自然排序，则返回null。
Object first()：返回集合中的第一个元素。
Object last()：返回集合中的最后一个元素。
Object lower(Object e)：返回集合中位于指定元素之前的元素（即小于指定元素的最大元素，参考元素不需要是TreeSet集合里的元素）。
Object higher (Object e)：返回集合中位于指定元素之后的元素（即大于指定元素的最小元素，参考元素不需要是TreeSet集合里的元素）。
SortedSet subSet(fromElement, toElement)：返回此Set的子集合，范围从fromElement（包含）到toElement（不包含）。
SortedSet headSet(toElement)：返回此Set的子集，由小于toElement的元素组成。
SortedSet tailSet(fromElement)：返回此Set的子集，由大于或等于fromElement的元素组成。

表面上看起来这些方法很复杂，其实它们很简单：因为TreeSet中的元素是有序的，所以增加了访问第一个、前一个、后一个、最后一个元素的方法，并提供了三个从TreeSet中截取子TreeSet的方法。

TreeSet nums=new TreeSet();
num.add(5);num.add(2);num.add(10);num.add(-9);
System.out.println(nums);
System.out.println(nums.first());
System.out.println(nums.last());
System.out.println(nums.headSet(4));
System.out.println(nums.tailSet(5));
System.out.println(nums.subSet(-3,4));

结果

[-9,2,5,10]

-9

10

[-9,2]

[5,10]

[2]

根据上面程序的运行结果即可看出，TreeSet并不是根据元素的插入顺序进行排序的，而是根据元素实际值的大小来进行排序的。

与HashSet集合采用hash算法来决定元素的存储位置不同，TreeSet采用红黑树的数据结构来存储集合元素。那么TreeSet进行排序的规则是怎样的呢？TreeSet支持两种排序方法：自然排序和定制排序。在默认情况下，TreeSet采用自然排序。

自然排序

TreeSet会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系，然后将集合元素按升序排列，这种方式就是自然排序。

Java提供了一个Comparable接口，该接口里定义了一个compareTo(Object obj)方法，该方法返回一个整数值，实现该接口的类必须实现该方法，实现了该接口的类的对象就可以比较大小。当一个对象调用该方法与另一个对象进行比较时，例如obj1.compareTo(obj2)，如果该方法返回0，则表明这两个对象相等；如果该方法返回一个正整数，则表明obj1大于obj2；如果该方法返回一个负整数，则表明obj1小于obj2。

如果试图把一个对象添加到TreeSet时，则该对象的类必须实现Comparable接口，否则程序将会抛出异常。如下程序示范了这个错误。

class A{}
class Test{
    main(){
        TreeSet ts=new TreeSet();
        ts.add(new A());ts.add(new A());
    }
}

上面程序试图向TreeSet集合中添加两个A对象，添加第一个对象时，TreeSet里没有任何元素，所以不会出现任何问题；当添加第二个A对象时，TreeSet就会调用该对象的compareTo(Object obj)方法与集合中的其他元素进行比较——如果其对应的类没有实现Comparable接口，则会引发ClassCastException异常

而且向TreeSet中添加的应该是同一个类的对象，否则也会引发ClassCastException异常。

对于TreeSet集合而言，它判断两个对象是否相等的唯一标准是：两个对象通过compareTo(Object obj)方法比较是否返回0——如果通过compareTo(Object obj)方法比较返回0，TreeSet则会认为它们相等；否则就认为它们不相等。

注意

当需要把一个对象放入TreeSet中，重写该对象对应类的equals()方法时，应保证该方法与compareTo(Object obj)方法有一致的结果，其规则是：如果两个对象通过equals()方法比较返回true时，这两个对象通过compareTo(Object obj)方法比较应返回0。

如果两个对象通过compareTo(Object obj)方法比较返回0时，但它们通过equals()方法比较返回false将很麻烦，因为两个对象通过compareTo(Object obj)方法比较相等，TreeSet不会让第二个元素添加进去，这就会与Set集合的规则产生冲突。

与HashSet类似的是，如果TreeSet中包含了可变对象，当可变对象的Field被修改时，TreeSet在处理这些对象时将非常复杂，而且容易出错。为了让程序更加健壮，推荐HashSet和TreeSet集合中只放入不可变对象。

定制排序

TreeSet的自然排序是根据集合元素的大小，TreeSet将它们以升序排列。如果需要实现定制排序，例如以降序排列，则可以通过Comparator接口的帮助。该接口里包含一个int compare(T o1, T o2)方法，该方法用于比较o1和o2的大小：如果该方法返回正整数，则表明o1大于o2；如果该方法返回0，则表明o1等于o2；如果该方法返回负整数，则表明o1小于o2。

class M{
    int age;
    public M(int age){
        this.age=age;
    }
    public String toString(){.....}
}
class Test{
    public static void main(){
        TreeSet ts =new TreeSet(new Comparator(){
            //根据对象age决定大小
           public int compare(Object o1,Object o2){
               M m1=(M)o1; M m2=(M)o2;
               return m1.age>m2.age?-1:m1.age<m2.age?1:0;
           } 
        });
        ts.add(new M(5)); ts.add(new M(-9)); ts.add(new M(3));
        sout(ts);
    }
}

结果：

[M对象(age:5),M对象(age:3),M对象(age:-9)]

EnumSet类

EnumSet是一个专为枚举类设计的集合类，EnumSet中的所有元素都必须是指定枚举类型的枚举值，该枚举类型在创建EnumSet时显式或隐式地指定。EnumSet的集合元素也是有序的，EnumSet以枚举值在Enum类内的定义顺序来决定集合元素的顺序。

EnumSet集合不允许加入null元素，如果试图插入null元素，EnumSet将抛出NullPointerException异常。如果只是想判断EnumSet是否包含null元素或试图删除null元素都不会抛出异常，只是删除操作将返回false，因为没有任何null元素被删除。

各Set的性能分析

HashSet和TreeSet是Set的两个典型实现，到底如何选择HashSet和TreeSet呢？HashSet的性能总是比TreeSet好（特别是最常用的添加、查询元素等操作），因为TreeSet需要额外的红黑树算法来维护集合元素的次序。只有当需要一个保持排序的Set时，才应该使用TreeSet，否则都应该使用HashSet。

HashSet还有一个子类：LinkedHashSet，对于普通的插入、删除操作，LinkedHashSet比HashSet要略微慢一点，这是由维护链表所带来的额外开销造成的；不过，因为有了链表，遍历LinkedHashSet会更快。

List集合

List接口和ListIterator接口

List作为Collection接口的子接口，当然可以使用Collection接口里的全部方法。而且由于List是有序集合，因此List集合里增加了一些根据索引来操作集合元素的方法。

void add(int index, Object element)：将元素element插入到List集合的index处。
boolean addAll(int index, Collection c)：将集合c所包含的所有元素都插入到List集合的index处。
Object get(int index)：返回集合index索引处的元素。
int indexOf(Object o)：返回对象o在List集合中第一次出现的位置索引。
int lastIndexOf(Object o)：返回对象o在List集合中最后一次出现的位置索引。
Object remove(int index)：删除并返回index索引处的元素。
Object set(int index, Object element)：将index索引处的元素替换成element对象，返回新元素。
List subList(int fromIndex, int toIndex)：返回从索引fromIndex（包含）到索引toIndex（不包含）处所有集合元素组成的子集合。

所有的List实现类都可以调用这些方法来操作集合元素。与Set集合相比，List增加了根据索引来插入、替换和删除集合元素的方法。

List books =new ArrayList();
books.add(new String("aaa"));books.add(new String("bbb"));book.add(new String("ccc"));
System.out.println(books);
//在第二个位置插入
book,add(1,new String("ddd"));
for(int i=0;i<books.size();i++){
    System.out.println(books.get(i));
}
books.remove(2);
System.out.println(books);
//输出1表明在第二个位置
System.out.println(books.indexOf("ddd"));//1
books.set(1,new String("bbb"));
System.out.println(books);
System.out.println(books.subList(1,2));

结果：

[aaa,bbb,ccc]

aaa

ddd

bbb

ccc

[aaa,ddd,ccc]

1

[aaa,bbb,ccc]

[bbb]

从上面运行结果清楚地看出List集合的用法。注意1行代码处，程序试图返回新字符串对象在List集合中的位置，实际上List集合中并未包含该字符串对象。因为List集合添加字符串对象时，添加的是通过new关键字创建的新字符串对象，1行代码处也是通过new关键字创建的新字符串对象，两个字符串显然不是同一个对象，但List的indexOf方法依然可以返回1。List判断两个对象相等的标准是什么呢？List判断两个对象相等只要通过equals()方法比较返回true即可。比如：

class A{ public boolean equals(Object obj){return true;}}
List books =new ArrayList();
books.add(new String("aaa"));books.add(new String("bbb"));book.add(new String("ccc"));
books.remove(new A());//1

执行①行代码时，程序试图删除一个A对象，List将会调用该A对象的equals()方法依次与集合元素进行比较，如果该equals()方法以某个集合元素作为参数时返回true，List将会删除该元素——A类重写了equals()方法，该方法总是返回true。所以我们看到每次从List集合中删除A对象，总是删除List集合中的第一个元素。

遍历元素

与Set只提供了一个iterator()方法不同，List还额外提供了一个listIterator()方法，该方法返回一个ListIterator对象，ListIterator接口继承了Iterator接口，提供了专门操作List的方法。ListIterator接口在Iterator接口基础上增加了如下方法。

boolean hasPrevious()：返回该迭代器关联的集合是否还有上一个元素。

Object previous()：返回该迭代器的上一个元素。

void add()：在指定位置插入一个元素。

ListIterator增加了向前迭代的功能（Iterator只能向后迭代），而且ListIterator还可通过add方法向List集合中添加元素（Iterator只能删除元素）。

List books =new ArrayList();
books.add(new String("aaa"));books.add(new String("bbb"));
ListIterator lit=books.listIterator();
while(lit.hasNext()){
    sout(lit.next());
    lit.add("xxxxxxxxxx");
}
sout("反向迭代-------------");
while(lit.hasPrevious()){
    sout(lit.previous());
}

使用ListIterator迭代List集合时，开始也需要采用正向迭代，即先使用next()方法进行迭代，在迭代过程中可以使用add()方法向上一次迭代元素的后面添加一个新元素。结果:

aaa

bbb

反向迭代-------------

xxxxxxxxxx

bbb

xxxxxxxxxx

aaa

ArrayList和Vector实现类

ArrayList和Vector类都是基于数组实现的List类，所以ArrayList和Vector类封装了一个动态的、允许再分配的Object[]数组。从源码（Java8）看，默认大小是10.

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = new Object[0];

ArrayList或Vector对象使用initialCapacity参数来设置该数组的长度，当向ArrayList或Vector中添加元素超出了该数组的长度时，它们的initialCapacity会自动增加。ArrayList和Vector还提供了如下两个方法来重新分配Object[]数组。

void ensureCapacity(int minCapacity)：将ArrayList或Vector集合的Object[]数组长度增加minCapacity。

void trimToSize()：调整ArrayList或Vector集合的Object[]数组长度为当前元素的个数。程序可调用该方法来减少ArrayList或Vector集合对象占用的存储空间。

ArrayList和Vector在用法上几乎完全相同，但由于Vector是一个古老的集合（从JDK 1.0就有了），那时候Java还没有提供系统的集合框架，所以Vector里提供了一些方法名很长的方法，例如addElement(Object obj)，实际上这个方法与add (Object obj)没有任何区别

ArrayList和Vector的显著区别是：ArrayList是线程不安全的，当多个线程访问同一个ArrayList集合时，如果有超过一个线程修改了ArrayList集合，则程序必须手动保证该集合的同步性；但Vector集合则是线程安全的，无须程序保证该集合的同步性。因为Vector是线程安全的，所以Vector的性能比ArrayList的性能要低。

public synchronized E firstElement() {
        if (this.elementCount == 0) {
            throw new NoSuchElementException();
        } else {
            return this.elementData(0);
        }
    }

由上面源码可见Vector是由synchronized实现同步。

实际上，即使需要保证List集合线程安全，也同样不推荐使用Vector实现类。有一个Collections工具类，它可以将一个ArrayList变成线程安全的。

LinkedList实现类

public class LinkedList<E> extends AbstractSequentialList<E> implements List<E>, Deque<E>, Cloneable, Serializable

以上为LinkedList的源码（Java8）可见该类实现了List和Deque接口，所以详见下面Deque接口。

固定长度的List

操作数组的工具类：Arrays，该工具类里提供了asList(Object... a)方法，该方法可以把一个数组或指定个数的对象转换成一个List集合，这个List集合既不是ArrayList实现类的实例，也不是Vector实现类的实例，而是Arrays的内部类ArrayList的实例。

@SafeVarargs
public static <T> List<T> asList(T... var0) {
    return new Arrays.ArrayList(var0);//1
}
上面1位置的这个类是在Arrays类中的内部类见下面
private static class ArrayList<E> extends AbstractList<E> implements RandomAccess, Serializable {
        private static final long serialVersionUID = -2764017481108945198L;
        private final E[] a;

        ArrayList(E[] var1) {
            this.a = (Object[])Objects.requireNonNull(var1);
        }

        public int size() {
            return this.a.length;
        }
        //。。。。。。
    }

Arrays.ArrayList是一个固定长度的List集合，程序只能遍历访问该集合里的元素，不可增加、删除该集合里的元素。试图增加删除元素都会引发UnsupportedOperationException异常。

Queue

Queue用于模拟队列这种数据结构，队列的头部保存存放时间最长的元素，队列的尾部保存存放时间最短的元素。queue接口中定义了如下几个方法：

void add(Object e):将指定元素加入到队列的尾部
Object element():获取队列头部的元素，但是不删除元素
boolean offer(Object e):将指定元素加入到队列的尾部。当时拥有容量限制的队列时，此方法只会返回false，而add会抛出IllegalStateException异常。
Object peek():获取队列头部的元素，但是不删除元素，如果队列为空，则返回null
Object poll():获取队列头部的元素，并删除元素。如果队列为空，则返回null
Object remove():获取队列头部的元素，并删除元素。

PriorityQueue实现类

PriorityQueue是一个比较标准的队列实现类。之所以说它是比较标准的队列实现，而不是绝对标准的队列实现，是因为PriorityQueue保存队列元素的顺序并不是按加入队列的顺序，而是按队列元素的大小进行重新排序。因此当调用peek()方法或者poll()方法取出队列中的元素时，并不是取出最先进入队列的元素，而是取出队列中最小的元素。从这个意义上来看，PriorityQueue已经违反了队列的最基本规则：先进先出（FIFO）。

    public static void main(String []args){
        Queue queue = new PriorityQueue();
        queue.add(30);
        queue.offer(15);
        queue.add(6);
        queue.offer(52);
        queue.add(-9);
        System.out.println(queue);
    }
运行结果：
[-9, 6, 15, 52, 30]

PriorityQueue不允许插入null元素，它还需要对队列元素进行排序，PriorityQueue的元素有两种排序方式。自然排序、定制排序。PriorityQueue队列对元素的要求与TreeSet对元素的要求基本一致。

Deque接口

Deque接口是Queue接口的子接口，它代表一个双端队列，Deque接口里定义了一些双端队列的方法，这些方法允许从两端来操作队列的元素。

void addFirst(Object e)：将指定元素插入该双端队列的开头。
void addLast(Object e)：将指定元素插入该双端队列的末尾。
Iterator descendingIterator()：返回该双端队列对应的迭代器，该迭代器将以逆向顺序来迭代队列中的元素。
Object getFirst()：获取但不删除双端队列的第一个元素。
Object getLast()：获取但不删除双端队列的最后一个元素。
boolean offerFirst(Object e)：将指定元素插入该双端队列的开头。
boolean offerLast(Object e)：将指定元素插入该双端队列的末尾。
Object peekFirst()：获取但不删除该双端队列的第一个元素；如果此双端队列为空，则返回null。
Object peekLast()：获取但不删除该双端队列的最后一个元素；如果此双端队列为空，则返回null。
Object pollFirst()：获取并删除该双端队列的第一个元素；如果此双端队列为空，则返回null。
Object pollLast()：获取并删除该双端队列的最后一个元素；如果此双端队列为空，则返回null。
Object pop()（栈方法）：pop出该双端队列所表示的栈的栈顶元素。相当于removeFirst()。
void push(Object e)（栈方法）：将一个元素push进该双端队列所表示的栈的栈顶。相当于addFirst(e)。
Object removeFirst()：获取并删除该双端队列的第一个元素。
Object removeFirstOccurrence(Object o)：删除该双端队列的第一次出现的元素o。
removeLast()：获取并删除该双端队列的最后一个元素。
removeLastOccurrence(Object o)：删除该双端队列的最后一次出现的元素o。

从上面方法中可以看出，Deque不仅可以当成双端队列使用，而且可以被当成栈来使用，因为该类里还包含了pop（出栈）、push（入栈）两个方法。

Deque方法与Queue方法对照

Queue的方法	Deque的方法
add(e)/offer(e)	addLast(e)/offerLast(e)
remove()/pool()	removeFirst()/poolFirst()
element()/peek()	getFirst()/peekFirst()

Deque方法与Stack方法对照

Stack的方法	Deque的方法
push(e)	addFirst(e)/offerFirst(e)
pop()	removeFirst()/poolFirst()
peek()	getFirst()/peekFirst()

Deque接口与ArrayDeque实现类

Deque接口提供了一个典型的实现类：ArrayDeque，从该名称就可以看出，它是一个基于数组实现的双端队列，创建Deque时同样可指定一个numElements参数，该参数用于指定Object[]数组的长度；如果不指定numElements参数，Deque底层数组的长度为16。以下为ArrayDeque的构造函数源码（Java8）

    public ArrayDeque() {
        this.elements = new Object[16];
    }

以下示例将ArrayDeque用作栈来使用：

public static void main(String[] args) {
        ArrayDeque stack = new ArrayDeque();
        stack.push("aaa");
        stack.push("bbb");
        stack.push("ccc");
        //输出 ccc,bbb,aaa
        System.out.println(stack);
        System.out.println(stack.peek());
        System.out.println(stack);
        System.out.println(stack.pop());
        System.out.println(stack);
    }

使用ArrayDeque的性能会更加出色，因此现在的程序中需要使用“栈”这种数据结构时，推荐使用ArrayDeque或LinkedList，而不是Stack。

Deque接口与LinkedList实现类

LinkedList类是List接口的实现类——这意味着它是一个List集合，可以根据索引来随机访问集合中的元素。除此之外，LinkedList还实现了Deque接口，因此它可以被当成双端队列来使用，自然也可以被当成“栈”来使用了。

简单示例：

public static void main(String[] args) {
        LinkedList linkedList = new LinkedList();
        linkedList.offer("aaa");//加入队列尾部
        linkedList.push("bbb");//加入栈的顶部
        linkedList.offerFirst("ccc");//加入到队列的头部（相当于栈的顶部）
        for (int i = 0; i <linkedList.size() ; i++) {
            System.out.println(linkedList.get(i));
        }
        System.out.println(linkedList.peekFirst());
        System.out.println(linkedList.peekLast());
        System.out.println(linkedList.pop());
        System.out.println(linkedList);
        System.out.println(linkedList.pollLast());
        System.out.println(linkedList);
    }

运行结果：

ccc
bbb
aaa
ccc
aaa
ccc
[bbb, aaa]
aaa
[bbb]

LinkedList与ArrayList、ArrayDeque的实现机制完全不同，ArrayList、ArrayDeque内部以数组的形式来保存集合中的元素，因此随机访问集合元素时有较好的性能；而LinkedList内部以链表的形式来保存集合中的元素，因此随机访问集合元素时性能较差，但在插入、删除元素时性能非常出色（只需改变指针所指的地址即可）。需要指出的是，虽然Vector也是以数组的形式来存储集合元素的，但因为它实现了线程同步功能，所以各方面性能都有所下降。

Map

Map用于保存具有映射关系的数据，因此Map集合里保存着两组值，一组值用于保存Map里的key，另外一组值用于保存Map里的value，key和value都可以是任何引用类型的数据。Map的key不允许重复，即同一个Map对象的任何两个key通过equals方法比较总是返回false。

Map与Set关系

Set与Map之间的关系非常密切。虽然Map中放的元素是key-value对，Set集合中放的元素是单个对象，但如果我们把key-value对中的value当成key的附庸：key在哪里，value就跟在哪里。这样就可以像对待Set一样来对待Map了。事实上，Map提供了一个Entry内部类来封装key-value对，而计算Entry存储时则只考虑Entry封装的key。从Java源码来看， Java是先实现了Map，然后通过包装一个所有value都为null的Map就实现了Set集合。

如果把Map里的所有value放在一起来看，它们又非常类似于一个List：元素与元素之间可以重复，每个元素可以根据索引来查找，只是Map中的索引不再使用整数值，而是以另一个对象作为索引。如果需要从List集合中取出元素，则需要提供该元素的数字索引；如果需要从Map中取出元素，则需要提供该元素的key索引。因此，Map有时也被称为字典，或关联数组。Map接口中定义了如下常用的方法。

void clear()：删除该Map对象中的所有key-value对。
boolean containsKey(Object key)：查询Map中是否包含指定的key，如果包含则返回true。
boolean containsValue(Object value)：查询Map中是否包含一个或多个value，如果包含则返回true。
Set entrySet()：返回Map中包含的key-value对所组成的Set集合，每个集合元素都是Map.Entry （Entry是Map的内部类）对象。
Object get(Object key)：返回指定key所对应的value；如果此Map中不包含该key，则返回null。
boolean isEmpty()：查询该Map是否为空（即不包含任何key-value对），如果为空则返回true。
Set keySet()：返回该Map中所有key组成的Set集合。
Object put(Object key, Object value)：添加一个key-value对，如果当前Map中已有一个与该key相等的key-value对，则新的key-value对会覆盖原来的key-value对。
void putAll(Map m)：将指定Map中的key-value对复制到本Map中。
Object remove(Object key)：删除指定key所对应的key-value对，返回被删除key所关联的value，如果该key不存在，则返回null。
int size()：返回该Map里的key-value对的个数。
Collection values()：返回该Map里所有value组成的Collection。

Map中包括一个内部类Entry，该类封装了一个key-value对。Entry包含如下三个方法。

Object getKey()：返回该Entry里包含的key值。

Object getValue()：返回该Entry里包含的value值。

Object setValue(V value)：设置该Entry里包含的value值，并返回新设置的value值。

所有的Map实现类都重写了toString()方法，调用Map对象的toString()方法总是返回如下格式的字符串：{key1=value1,key2=value2...}。

HashMap和Hashtable实现类

HashMap和Hashtable都是Map接口的典型实现类，它们之间的关系完全类似于ArrayList和Vector的关系：Hashtable是一个古老的Map实现类，它从JDK 1.0起就已经出现了，当它出现时，Java还没有提供Map接口，所以它包含了两个烦琐的方法，即elements()（类似于Map接口定义的values()方法）和keys()（类似于Map接口定义的keySet()方法），现在很少使用这两个方法

区别：

Hashtable是一个线程安全的Map实现，但HashMap是线程不安全的实现，所以HashMap比Hashtable的性能高一点；但如果有多个线程访问同一个Map对象时，使用Hashtable实现类会更好。

Hashtable不允许使用null作为key和value，如果试图把null值放进Hashtable中，将会引发NullPointerException异常；但HashMap可以使用null作为key或value。

由于HashMap里的key不能重复，所以HashMap里最多只有一个key-value对的key为null，但可以有无数多个key-value对的value为null。例如：

main(){
    HashMap hm=new HashMap();
    hm.put(null,null);
    //1处无法将key-value对放入，因为Map中已经有一个key-value对的key为null值
    hm.put(null,null);//1
    //2代码处可以放入该key-value对，因为一个HashMap中可以有多个value为null值
    hm.put("a",null);//2
    sout(hm);
}

为了成功地在HashMap、Hashtable中存储、获取对象，用作key的对象必须实现hashCode()方法和equals()方法。与HashSet集合不能保证元素的顺序一样，HashMap、Hashtable也不能保证其中key-value对的顺序。

类似于HashSet，HashMap、Hashtable判断两个key相等的标准也是：两个key通过equals()方法比较返回true，两个key的hashCode值也相等。

与HashSet类似的是，如果使用可变对象作为HashMap、Hashtable的key，并且程序修改了作为key的可变对象，则也可能出现与HashSet类似的情形：程序再也无法准确访问到Map中被修改过的key。

遍历

遍历Map中的全部key-value对：调用Map对象的keySet()方法返回全部key组成的Set集合，通过遍历该Set集合的所有元素（就是Map的全部key）就可以遍历Map中的所有key-value对。

for(Object key:hm.keySet()){
    sout(key);
    sout(ht.get(key));
}

LinkedHashMap实现类

HashSet有一个子类是LinkedHashSet，HashMap也有一个LinkedHashMap子类；LinkedHashMap也使用双向链表来维护key-value对的次序（其实只需要考虑key的次序），该链表负责维护Map的迭代顺序，迭代顺序与key-value对的插入顺序保持一致。

LinkedHashMap可以避免对HashMap、Hashtable里的key-value对进行排序（只要插入key-value对时保持顺序即可），同时又可避免使用TreeMap所增加的成本。

LinkedHashMap scores=new LinkedHashMap();
scores.put("语文",80);
scores.put("数学",70);
scores.put("英语",90);
for(Object key :scores.keySet()){
    sout(key+"--->"+scores.get(key));
}

使用Properties读写属性文件

Properties类是Hashtable类的子类，正如它的名字所暗示的，该对象在处理属性文件时特别方便（Windows操作平台上的ini文件就是一种属性文件）。Properties类可以把Map对象和属性文件关联起来，从而可以把Map对象中的key-value对写入属性文件中，也可以把属性文件中的“属性名=属性值”加载到Map对象中。由于属性文件里的属性名、属性值只能是字符串类型，所以Properties里的key、value都是字符串类型。该类提供了如下三个方法来修改Properties里的key、value值。

String getProperty(String key)//获取Properties中指定属性名对应的属性值，类似于Map的get(Object key)方法。
String getProperty(String key, String defaultValue)//该方法与前一个方法基本相似。该方法多一个功能，如果Properties中不存在指定的key时，则该方法指定默认值。
Object setProperty(String key, String value)//设置属性值，类似于Hashtable的put()方法。

除此之外，它还提供了两个读写Field文件的方法。

void load(InputStream inStream)//从属性文件（以输入流表示）中加载key-value对，把加载到的key-value对追加到Properties里（Properties是Hashtable的子类，它不保证key-value对之间的次序）。
void store(OutputStream out, String comments)//将Properties中的key-value对输出到指定的属性文件（以输出流表示）中。

示例：

Properties props =new Properties();
props.setProperty("username","haha");
props.setProperty("password","123456");
props.store(new FileOutPutStream("a.ini"),"comment line");//1
Properties props2 =new Properties();
props2.setProperty("gender","male");
props2.load(new FileInputStream("a.ini"))//2
sout(props2)

其中①代码处将Properties对象中的key-value对写入a.ini文件中；②代码处则从a.ini文件中读取key-value对，并添加到props2对象中.

Properties可以把key-value对以XML文件的形式保存起来，也可以从XML文件中加载key-value对，用法与此类似，此处不再赘述。

SortedMap接口和TreeMap实现类

正如Set接口派生出SortedSet子接口，SortedSet接口有一个TreeSet实现类一样，Map接口也派生出一个SortedMap子接口，SortedMap接口也有一个TreeMap实现类。

TreeMap就是一个红黑树数据结构，每个key-value对即作为红黑树的一个节点。TreeMap存储key-value对（节点）时，需要根据key对节点进行排序。TreeMap可以保证所有的key-value对处于有序状态。TreeMap也有两种排序方式。

自然排序：TreeMap的所有key必须实现Comparable接口，而且所有的key应该是同一个类的对象，否则将会抛出ClassCastException异常。

定制排序：创建TreeMap时，传入一个Comparator对象，该对象负责对TreeMap中的所有key进行排序。采用定制排序时不要求Map的key实现Comparable接口。

TreeSet类似的是，TreeMap中也提供了一系列根据key顺序访问key-value对的方法。

Map.Entry firstEntry()//返回该Map中最小key所对应的key-value对，如果该Map为空，则返回null。
Object firstKey()//返回该Map中的最小key值，如果该Map为空，则返回null。
Map.Entry lastEntry()//返回该Map中最大key所对应的key-value对，如果该Map为空或不存在这样的key-value对，则都返回null。
Object lastKey()//返回该Map中的最大key值，如果该Map为空或不存在这样的key，则都返回null。
Map.Entry higherEntry(Object key)//返回该Map中位于key后一位的key-value对（即大于指定key的最小key所对应的key-value对）。如果该Map为空，则返回null。
Object higherKey(Object key)//返回该Map中位于key后一位的key值（即大于指定key的最小key值）。如果该Map为空或不存在这样的key-value对，则都返回null。
Map.Entry lowerEntry(Object key)//返回该Map中位于key前一位的key-value对（即小于指定key的最大key所对应的key-value对）。如果该Map为空或不存在这样的key-value对，则都返回null。
Object lowerKey(Object key)//返回该Map中位于key前一位的key值（即小于指定key的最大key值）。如果该Map为空或不存在这样的key，则都返回null。
NavigableMap subMap(Object fromKey, boolean fromInclusive, Object toKey,boolean toInclusive)//返回该Map的子Map，其key的范围是从fromKey（是否包括取决于第二个参数）到toKey（是否包括取决于第四个参数）。
SortedMap subMap(Object fromKey, Object toKey)//返回该Map的子Map，其key的范围是从fromKey（包括）到toKey（不包括）。
SortedMap tailMap(Object fromKey)//返回子Map，其key的范围是大于fromKey（包括）的所有key
NavigableMap tailMap(Object fromKey, boolean inclusive)//返回该Map的子Map，其key的范围是大于fromKey（是否包括取决于第二个参数）的所有key。
SortedMap headMap(Object toKey)//返回该Map的子Map，其key的范围是小于toKey（不包括）的所有key。
NavigableMap headMap(Object toKey, boolean inclusive)//返回该Map的子Map，其key的范围是小于toKey（是否包括取决于第二个参数）的所有key。

因为TreeMap中的key-value对是有序的，所以增加了访问第一个、前一个、后一个、最后一个key-value对的方法，并提供了几个从TreeMap中截取子TreeMap的方法。

类似于TreeSet中判断两个元素相等的标准，TreeMap中判断两个key相等的标准是：两个key通过compareTo()方法返回0，TreeMap即认为这两个key是相等的。

注意

再次强调：Set和Map的关系十分密切，Java源码就是先实现了HashMap、TreeMap等集合，然后通过包装一个所有的value都为null的Map集合实现了Set集合类。

各种实现类的分析

对于Map的常用实现类而言，HashMap和Hashtable的效率大致相同，因为它们的实现机制几乎完全一样；但HashMap通常比Hashtable要快一点，因为Hashtable需要额外的线程同步控制。

TreeMap通常比HashMap、Hashtable要慢（尤其在插入、删除key-value对时更慢），因为TreeMap底层采用红黑树来管理key-value对（红黑树的每个节点就是一个key-value对）。

使用TreeMap有一个好处：TreeMap中的key-value对总是处于有序状态，无须专门进行排序操作。当TreeMap被填充之后，就可以调用keySet()，取得由key组成的Set，然后使用toArray()方法生成key的数组，接下来使用Arrays的binarySearch()方法在已排序的数组中快速地查询对象。

对于一般的应用场景，程序应该多考虑使用HashMap，因为HashMap正是为快速查询设计的（HashMap底层其实也是采用数组来存储key-value对）。但如果程序需要一个总是排好序的Map时，则可以考虑使用TreeMap。LinkedHashMap比HashMap慢一点，因为它需要维护链表来保持Map中key-value时的添加顺序。IdentityHashMap性能没有特别出色之处，因为它采用与HashMap基本相似的实现，只是它使用==而不是equals()方法来判断元素相等。

操作集合的工具类：Collections

Java提供了一个操作Set、List和Map等集合的工具类：Collections，该工具类里提供了大量方法对集合元素进行排序、查询和修改等操作，还提供了将集合对象设置为不可变、对集合对象实现同步控制等方法。

排序操作

static void reverse(List list)：反转指定List集合中元素的顺序。

static void shuffle(List list)：对List集合元素进行随机排序（shuffle方法模拟了“洗牌”动作）。

static void sort(List list)：根据元素的自然顺序对指定List集合的元素按升序进行排序。

static void sort(List list, Comparator c)：根据指定Comparator产生的顺序对List集合元素进行排序。

static void swap(List list, int i, int j)：将指定List集合中的i处元素和j处元素进行交换。

static void rotate(List list , int distance)：当distance为正数时，将list集合的后distance个元素“整体”移到前面；当distance为负数时，将list集合的前distance个元素“整体”移到后面。该方法不会改变集合的长度。

ArrayList nums=new ArrayList();
nums.add(2);nums.add(-5);nums.add(3);nums.add(0);
sout(nums);
Collections.reverse(nums);//反转
sout(nums);
Collections.sort(nums);//排序
sout(nums);
Collections.shuffle(nums);//随机排序
sout(nums);

查找替换操作

Collections还提供了如下用于查找、替换集合元素的常用方法。

static int binarySearch(List list, Object key)：使用二分搜索法搜索指定的List集合，以获得指定对象在List集合中的索引。如果要使该方法可以正常工作，则必须保证List中的元素已经处于有序状态。

static Object max(Collection coll)：根据元素的自然顺序，返回给定集合中的最大元素。

static Object max(Collection coll, Comparator comp)：根据Comparator指定的顺序，返回给定集合中的最大元素。

static Object min(Collection coll)：根据元素的自然顺序，返回给定集合中的最小元素。

static Object min(Collection coll, Comparator comp)：根据Comparator指定的顺序，返回给定集合中的最小元素。

static void fill(List list, Object obj)：使用指定元素obj替换指定List集合中的所有元素。

static int frequency(Collection c, Object o)：返回指定集合中指定元素的出现次数。

static int indexOfSubList(List source, List target)：返回子List对象在父List对象中第一次出现的位置索引；如果父List中没有出现这样的子List，则返回-1。

static int lastIndexOfSubList(List source, List target)：返回子List对象在父List对象中最后一次出现的位置索引；如果父List中没有出现这样的子List，则返回-1。

static boolean replaceAll(List list, Object oldVal, Object newVal)：使用一个新值newVal替换List对象的所有旧值oldVal。

同步控制

Collections类中提供了多个synchronizedXxx()方法，该方法可以将指定集合包装成线程同步的集合，从而可以解决多线程并发访问集合时的线程安全问题。

Java中常用的集合框架中的实现类HashSet、TreeSet、ArrayList、ArrayDeque、LinkedList、HashMap和TreeMap都是线程不安全的。如果有多个线程访问它们，而且有超过一个的线程试图修改它们，则可能出现错误。Collections提供了多个静态方法可以把它们包装成线程同步的集合。

public static void main(){
    Collection c =Collections.synchronizedCollection(new ArrayList());
    List list =Collections.synchronizedList(new ArrayList());
    Set s=Collections.synchronizedSet(new HashSet());
    Map m=Collections.synchronizedLMap(new HashMap();
}

将新创建的集合对象传给了Collections的synchronizedXxx方法，这样就可以直接获取List、Set和Map的线程安全实现版本。

设置不可变集合

Collections提供了如下三类方法来返回一个不可变的集合。

emptyXxx()：返回一个空的、不可变的集合对象，此处的集合既可以是List，也可以是Set，还可以是Map。

singletonXxx()：返回一个只包含指定对象（只有一个或一项元素）的、不可变的集合对象，此处的集合既可以是List，也可以是Set，还可以是Map。

unmodifiableXxx：返回指定集合对象的不可变视图，此处的集合既可以是List，也可以是Set，还可以是Map。

上面三类方法的参数是原有的集合对象，返回值是该集合的“只读”版本。通过Collections提供的三类方法，可以生成“只读”的Collection或Map。

List unmodifiableList=Collections.emptyList();//创建一个空的、不可改变的List对象
Set unmodifiableSet=Collections.singleton("aaa");//创建一个只有一个元素，且不可改变的Set对象
Map scores = new HashMap();
spours.put("yuwen",90);spours.put("yingyu",80);
Map unmodifiableMap=Collections.unmodifiableMap(scores);
unmodifiableList.add("xxx");
unmodifiableSet.add("xxx");
unmodifiableMap.put("yuwen",90);

上面程序的3行粗体字代码分别定义了一个空的、不可变的List对象，一个只包含一个元素的、不可变的Set对象和一个不可变的Map对象。不可变的集合对象只能访问集合元素，不可修改集合元素。所以上面程序中①②③处的代码都将引发UnsupportedOperationException异常。

作者：Loserfromlazy

出处：https://home.cnblogs.com/u/yhr520/

本文版权归作者和博客园共有，欢迎转载，但必须给出原文链接，并保留此段声明，否则保留追究法律责任的权利。