【转载】Java集合容器全面分析

转自:http://blog.csdn.net/garfielder007/article/details/52143803

简介:

集合类Collection不是Java的核心类,是Java的扩展类。集合可以用来储存任何类型的对象,给程序员提供了代码编写的灵活性,但是同时也带来了类型安全的问题。JDK1.5集以上的版本支持Generics,这种新概念的提出改变了Java传统代码的编写方式。(Generics type)编程概念和技术应用于集合类,解决了集合类的类型安全问题,这可用于对任何数据类型的定义和操作。

集合和数组有了紧密的联系又有很多的不同之处。

集合和数组的相同之处:

1、它们都用来储存多个对象

2、有些集合类,例如ArrayList,实际上应用数组结构储存对象

集合类和数组的不同之处:

1、集合类是Java的扩充的API类,而数组是Java语言本身的数据结构

2、集合储存的对象是动态可变的,而数组的大小是静态不变的

3、集合只可用于储存对象,而数组可用来储存基本类型或者对象

4、集合一般使用方法,例如add(),或者iterator(),来添加或访问对象,而数组使用下标

5、集合可使用众多的方法,而数组可使用的方法较少




从整体的角度来看,集合类由两部分组成:Collection接口和Map接口。二级接口Set和List继承了Collection接口,并且导出三个常用的集合类HashSet、ArrayList、LinkedList

接口Map提供了两个常用的集合类:HaspMap、TreeMap

Collection和Map都包括在java。util包中。

Coll2ection定义接口类的基本方法,其二级接口Set与List是将集合类分为不同功能的两大类:Set(不允许有重复元素)、List(允许有重复元素)


虽然集合类有两个独立的接口构成,但是它们有着许多相同的集合操作方式,它们之间的不同在于对元素的储存方式。

1、Collection:定义对所有集合类操作的基本方法,例如size()/isEmpty()/contains()/add()/remove()/isterator()等15个方法,这是从Iterable接口继承而来。

2、Set:定义不允许重复元素和集合类的基本操作方法,集成Collection中的所有方法

3、List:定义允许重复元素的集合类的基本操作方法,继承了Collection‘中定义的所有方法,定义对一些方法的重载签名,增添了新的方法。

4、Map:定义对所有map集合类操作的基本方法,例如containsKey()/containsValue()/keySet()/put()/values()等14个方法,它本身就是一个根接口。


(1)ArrayList:数组式结构的集合类,其大小可自动调整,保持元素添加的位置,对元素的有序和随机访问非常有效,但不在结尾添加元素时效率不高

(2)LinkedList:与ArrayList相似,但应用链接式结构,不再结尾位置添加和删除元素非常有效

(3)HashSet:应用Hash码储存五重复元素的集合类,储存的元素必须完善hashCode()方法以保证其唯一性


我们在一般情况下,就可以把ArrayList和LinkedList看成是C语言中的数组和链表,它们的优劣性都可以参照一下。


Map接口中的常用类:

(1)HashMap:与HashSet相似,但它们属于不同的接口,以key-value一一对应的方式来储存无重复元素。

(2)TreeMap:与HashMap相似,但以树tree的数据结构储存元素,元素必须是key-value意义对应的方法储存,且自动按照key对象排序。

对于Map的KeySet()方法返回类型是Set,而Values()的返回类型是Collection。(应用性比较广)

下面两个程序,比较map中key-value的一一对应:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package connections;  
  2.   
  3. import java.util.HashMap;  
  4. import java.util.Map;  
  5.   
  6. public class EmployeeMapTest {  
  7.     public static void main(String[] args) {  
  8.         Map<String, String> employeeMap = new HashMap<String, String>();  
  9.         employeeMap.put("1000""litianpeng");  
  10.         employeeMap.put("115""zuxiaoyu");  
  11.         employeeMap.put("1102""lihuanhuan");  
  12.         //employeeMap.put("115", "surprise");  
  13.         System.out.println(employeeMap);  
  14.     }  
  15. }  
运行截图:


[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package connections;  
  2.   
  3. import java.util.HashMap;  
  4. import java.util.Map;  
  5.   
  6. public class EmployeeMapTest {  
  7.     public static void main(String[] args) {  
  8.         Map<String, String> employeeMap = new HashMap<String, String>();  
  9.         employeeMap.put("1000""litianpeng");  
  10.         employeeMap.put("115""zuxiaoyu");  
  11.         employeeMap.put("1102""lihuanhuan");  
  12.         employeeMap.put("115""surprise");  
  13.         System.out.println(employeeMap);  
  14.     }  
  15. }  
运行截图:


可以看出来key=115的键值已经被替代了。


下面介绍Collection集合类:

1、ArraList:以数组作为实现的结构,氮元素不受固定空间的限制,是大小可变的数组,但是任何不再结尾处增添元素的操作,都需要移位,ArrayList可以接受任何Object对象作为它的元素,但不允许是基本类型,且对元素的访问和操作通过调用方法进行。

注意:系统预设ArrayList的元素数为10,可以指定ArrayList对象储存元素的大小,其空间将随着元素的增添和清除而自动增加或者减少。

2、LinkedList:链接表LinkedList与ArrayList相似,但应用节点node数据结构实现,因而提高了不再结尾处增添或者删除元素操作的效率。

3、HashSet:HashSet集合主要应用于简单快速、与检索有关的操作

HashSet与ArrayList和LinkedList相比,主要有下列不同的特点:

(1)应用hash表结构

(2)不允许有重复的元素

(3)元素是无序的,即按照哈希码储存

(4)自定义集合元素必须覆盖hashcode()方法来产生哈希码

4、Iterator:元素迭代器,在ArrayList和LinkedList中都提供方法iterator(),用来返回一个指定类型的元素迭代器Iterator对集合的引用,用来对各元素按次序遍历。

boolean hasNext():如果仍有元素,返回真,否则返回假

E next():返回下一个元素

void remove():删除迭代器当前指向集合中的元素


下面介绍Map集合类:

主要包括HashMap和TreeMap两大类,它们中的每一个元素必须应用一对key-value来储存。由key来映射value。

注意

(1)key与value必须是对象,而不允许是基本数据类型

(2)key在一个集合中必须具有唯一性,即key不允许有重复,但允许有重复的value出现

1、HashMap:HashMap实现Map接口,它利用Hash表结构,因而集合中的元素不按次序排列。

注意:系统预设HashMap的元素数目为16,也可以自己指定HashMap储存的元素数目。

由于HashMap不支持迭代器,可以利用keySet()方法,以set引用返回HashMap集合中所有的key,再利用元素迭代器对元素进行遍历,对元素的遍历,可以调用values()实现

2、TreeMap:TreeMap与HashMap相似,实现了Map接口,所有元素都是key-value的映射。两者之间的不同点在于

(1)TreeMap是应用于Tree数据结构储存key-value元素,而HashMap利用Hash表结构

(2)TreeMap集合中的各个映射单元是按照key自动排序的,而HashMap集合中的各映射单元是无序的

(3)TreeMap集合更加有效利用存储空间,而HashMap必须指定或者使用预设映射单元存储空间


一、Set与Map

Set集合的继承体系:


Map集合的继承体系:


从上面的继承关系我们可以看出来,实现Map接口和Set接口的接口名、类名完全相似。

从上一篇博文的分析我们可以知道,Map集合的key具有一个特征:所有的key不能重复,且key之间没有顺序(TreeMap是有顺序的),如果将Map集合的所有key集中起来,那这些key就组成了一个set集合,则map集合提供了keySet()方法返回所有key组成的集合。这样就实现了Map到Set之间的转换。其实也可以实现Set到Map之间的转换。

下面简单实现一下将Set扩展成Map,自定义个一个SimpleEntry类,

代码如下:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.HashSet;  
  4. import java.util.Iterator;  
  5. import java.util.Map;  
  6.   
  7. class SimpleEntry<K, V> implements Map.Entry<K, V>, java.io.Serializable {  
  8.     private final K key;  
  9.     private V value;  
  10.   
  11.     public SimpleEntry(K key, V value) {  
  12.         this.key = key;  
  13.         this.value = value;  
  14.     }  
  15.   
  16.     public SimpleEntry(Map.Entry<? extends K, ? extends V> entry) {  
  17.         this.key = entry.getKey();  
  18.         this.value = entry.getValue();  
  19.     }  
  20.   
  21.     public K getKey() {  
  22.         return key;  
  23.     }  
  24.   
  25.     public V getValue() {  
  26.         return value;  
  27.     }  
  28.   
  29.     public V setValue(V value) {  
  30.         V oldValue = this.value;  
  31.         this.value = value;  
  32.         return oldValue;  
  33.     }  
  34.   
  35.     public boolean equals(Object o) {  
  36.         if (o == this) {  
  37.             return true;  
  38.         }  
  39.         if (o.getClass() == SimpleEntry.class) {  
  40.             SimpleEntry se = (SimpleEntry) o;  
  41.             return se.getKey().equals(getKey());  
  42.         }  
  43.         return false;  
  44.     }  
  45.   
  46.     public int hashCode() {  
  47.         return key == null ? 0 : key.hashCode();  
  48.     }  
  49.   
  50.     public String toString() {  
  51.         return key + "=" + value;  
  52.     }  
  53. }  
  54.   
  55. public class Set2Map<K, V> extends HashSet<SimpleEntry<K, V>> {  
  56.     public void clear() {  
  57.         super.clear();  
  58.     }  
  59.   
  60.     public boolean containsKey(K key) {  
  61.         return super.contains(new SimpleEntry<K, V>(key, null));  
  62.     }  
  63.   
  64.     boolean containsValue(Object value) {  
  65.         for (SimpleEntry<K, V> se : this) {  
  66.             if (se.getValue().equals(value)) {  
  67.                 return true;  
  68.             }  
  69.         }  
  70.         return false;  
  71.     }  
  72.   
  73.     public V get(Object key) {  
  74.         for (SimpleEntry<K, V> se : this) {  
  75.             if (se.getKey().equals(key)) {  
  76.                 return se.getValue();  
  77.             }  
  78.         }  
  79.         return null;  
  80.     }  
  81.   
  82.     public V put(K key, V value) {  
  83.         add(new SimpleEntry<K, V>(key, value));  
  84.         return value;  
  85.     }  
  86.   
  87.     public void putAll(Map<? extends K, ? extends V> m) {  
  88.         for (K key : m.keySet()) {  
  89.             add(new SimpleEntry<K, V>(key, m.get(key)));  
  90.         }  
  91.     }  
  92.   
  93.     public V removeEntry(Object key) {  
  94.         for (Iterator<SimpleEntry<K, V>> it = this.iterator(); it.hasNext();) {  
  95.             SimpleEntry<K, V> en = (SimpleEntry<K, V>) it.next();  
  96.             if (en.getKey().equals(key)) {  
  97.                 V v = en.getValue();  
  98.                 it.remove();  
  99.                 return v;  
  100.             }  
  101.         }  
  102.         return null;  
  103.     }  
  104.   
  105.     public int size() {  
  106.         return super.size();  
  107.     }  
  108. }  

自定义的一个SimpleEntry<K,V>类,当一个Set的所有集合元素都是SimpleEntry<K,V>对象的时候,该Set就变成了一个Map<K,V>集合。接下来,程序以HashSet<SimpleEntry<K,V>>为父类派生了一个子类Set2Map<K,V>,这个扩展类完全可以被当成Map使用,因此上面程序中的Set2Map<K,V>类中也提供了Map集合应该提供的绝大部分方法。

总结:可以通过对Set加以改造,将Set变为Map,这个改造的Map集合在功能上几乎可以和系统提供的Map一样。


二、HashMap与HashSet分析比较:

1、HashMap与HashSet都是采用传统的Hash算法决定集合的存储位置,这样可以保证快速存、取集合元素。

注意:集合虽然说存储Java对象,但实际上不会真正将Java对象放入Set集合中,而只是在Set集合中保留这些对象的引用罢了。

对于HashMap、HashSet及其子类而言,它们采用了Hash算法来决定集合中元素的存储位置

当在创建HashMap的时候,有一个默认的负载因子,其默认值为0.75,,这是时间和空间成本上的一种折衷,增大负载因子就可以减少Hash表所占用的内存空间,但会增加查询数据的时间开销,而查询又是最频繁的操作。减小负载因子会提高数据查询的性能,但是增加Hash表所占用的内存空间。

2、对于HashSet,它是基于HashMap实现的,HashSet底层采用HashMap来保存所有的元素,因此HashSet的实现相对容易一些。

注意:HashSet的绝大部分方法都是通过调用HashMap来实现的,因此HashSet和HashMap两个集合在实现本质上是相同的。

如果向HashSet中添加一个已经存在的元素,新添加的集合元素不会覆盖已有的集合元素。

下面我们看一个精彩的程序:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.HashSet;  
  4. import java.util.Set;  
  5.   
  6. public class HashSetTest {  
  7.     public static void main(String[] args) {  
  8.         Set<Name> s = new HashSet<Name>();  
  9.         s.add(new Name("li""tianpeng"));  
  10.         System.out.println(s.contains(new Name("li""tianpeng")));  
  11.     }  
  12. }  
  13.   
  14. class Name {  
  15.     private String first;  
  16.     private String last;  
  17.   
  18.     public Name(String first, String last) {  
  19.         this.first = first;  
  20.         this.last = last;  
  21.     }  
  22. }  
下面是结果截图:

打印出来的结果竟然是“false”,我们命名已经添加了一个new Name("abc","123")对象。

这是因为HashSet判断两个对象相等的标准除了要通过equals()方法比较返回true之外,还要两个对象的hashCode()返回值相等,而上面的程序没有没有重写Name类的hashCode()方法,两个Name对象的返回值并不相等,因此HashSet会把它们当成2个对象来处理。

下面重写了hashCode()方法:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.HashSet;  
  4. import java.util.Set;  
  5.   
  6. public class HashSetTest {  
  7.     public static void main(String[] args) {  
  8.         Set<Name> s = new HashSet<Name>();  
  9.         s.add(new Name("li""tianpeng"));  
  10.         System.out.println(s.contains(new Name("li""tianpeng")));  
  11.     }  
  12. }  
  13.   
  14. class Name {  
  15.     private String first;  
  16.     private String last;  
  17.   
  18.     public Name(String first, String last) {  
  19.         this.first = first;  
  20.         this.last = last;  
  21.     }  
  22.   
  23.     public int hashCode() {  
  24.         return first.hashCode();  
  25.     }  
  26.   
  27.     public boolean equals(Object o) {  
  28.         if (this == o)  
  29.             return true;  
  30.         if (o.getClass() == Name.class) {  
  31.             Name n = (Name) o;  
  32.             return n.first.equals(first);  
  33.         }  
  34.         return false;  
  35.     }  
  36. }  
运行结果截图如下:



三、TreeMap与TreeSet比较分析:

1、TreeSet底层采用一个NavigableMap来保存TreeSet集合的元素,但是,由于NavigableMap只是一个接口,因此底层仍然使用TreeMap来包含集合中所有元素。

注意:TreeSet里绝大部分方法都是直接调用TreeMap的方法来实现的。

2、TreeMap则采用一种“红黑树”的排序二叉树来保存Map中的每一个元素,每个元素被当成“红黑树”的一个节点对待。

每次添加一个新元素时,此新元素作为“红黑树”的根节点被添加到已有的红黑树中。这样利用红黑树可以快速地插入与删除还有查找。

下面是TreeMap的应用程序:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.TreeMap;  
  4.   
  5. public class TreeMapTest {  
  6.     public static void main(String[] args) {  
  7.         TreeMap<String, Double> map = new TreeMap<String, Double>();  
  8.         map.put("ccc"89.0);  
  9.         map.put("zzz"89.0);  
  10.         map.put("aaa"89.0);  
  11.         map.put("bbb"89.0);  
  12.         System.out.println(map);  
  13.     }  
  14. }  
运行结果如下:


关于红黑树的介绍:以后我们会慢慢提到。

总结:Treemap本质上就是一个“红黑树”,而TreeMap上的每一个元素就是该红黑树上的节点。


四、Map和List比较分析:

1、Map的values()方法,Map集合是一个关联数组,Map可以根据key来获取对应的value,所以这些value可以组成一个List集合。但是Map的values()方法并未返回一个List集合。

可以从下面的代码中看出:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.HashMap;  
  4. import java.util.TreeMap;  
  5.   
  6. public class MapValueTest {  
  7.     public static void main(String[] args) {  
  8.         HashMap<String, Double> scores = new HashMap<String, Double>();  
  9.         scores.put("语文"89.0);  
  10.         scores.put("数学"83.0);  
  11.         scores.put("英文"84.0);  
  12.         System.out.println(scores.values());  
  13.         System.out.println(scores.values().getClass());  
  14.         TreeMap<String, Double> health = new TreeMap<String, Double>();  
  15.         health.put("身高"173.0);  
  16.         health.put("体重"171.0);  
  17.         System.out.println(health.values());  
  18.         System.out.println(health.values().getClass());  
  19.     }  
  20. }  
运行结果如下:


可以看出来Map中values()方法返回的值的集合不是List对象。

2、TreeMap:与HashMap优点类似,TreeMap的values()方法返回同样的Values对象,但是此处的Values类是TreeMap的私有内部类,因为TreeMap是用“红黑树”实现的,所以此时Values类当然要考虑红黑树的一些特性。

总结:HashMap和TreeMap中的values()方法并未把Map中的value重新组合成一个包含元素的集合对象,这样可以大大降低系统的开销。


五、Map和List的分析比较:

Map与Set的底层结构很相似,从用法也有一些相似的地方:

(1)Map接口提供了get(K key)方法允许Map对象根据key取得value

(2)List接口提供了get(int index)方法允许List对象根据元素索引取得value

可以把List看成所有key都是int类型的Map,也可以把Map看成key可以是任何类型的List。


六、ArrayList和LinkedList分析比较:

在List集合的实现类中,主要有3种:ArrayList、Vector和LinkedList。其中Vector还有一个Stack子类,此Stack子类仅在Vector父类的基础上增加了5个方法,这5个方法就将一个Vector扩展成了Stack,实际从本质上来讲,Stack仍然是一个Vector,它只是比Vector多了5个方法罢了。

但实际上,Java不推荐使用Stack类,而使推荐使用Deque实现类,Java提供了一个Deque接口,并为该接口提供了一个ArrayDeque实现类,在无需保证线程安全的情况下,程序完全可以使用ArrayDeque来代替Stack类。

Deque接口代表双端队列这种数据结构,它既有队列FIFO的性质,也有栈FILO的性质。

1、Vector与ArrayList区别:

(1)从序列化机制来看,ArrayList的实现比Vector实现更安全

(2)但Vector是ArrayList的线程安全版本,Vector和ArrayList的绝大部分方法都是相同的,只是Vector的方法增加了synchronized关键字

注意:在多线程条件下使用List集合,而且需要保证List集合的线程安全,仍然可以不使用Vector,考虑将ArrayList包装成线程安全的集合类。Java提供了一个Collections工具类,通过该工具类synchronizedList方法可以将一个普通的ArrayList包装成线程安全的ArrayList。

2、ArrayList和LinkedList区别:

(1)ArrayList是一种顺序存储的线性表

(2)LinkedList是一种链式存储的线性表,其本质就是一个双向链表,因为它不仅实现了List接口,而且实现了Deque接口。

总结:ArrayList取数的性能优越,LinkedList插入、删除的性能优越。


七、Iterator迭代器:

下面看关于迭代器的几个代码:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.ArrayList;  
  4. import java.util.Iterator;  
  5.   
  6. public class ArrayListRemove {  
  7.     public static void main(String[] args) {  
  8.         ArrayList<String> list = new ArrayList<String>();  
  9.         list.add("111");  
  10.         list.add("222");  
  11.         list.add("333");  
  12.         Iterator<String> it = list.iterator();  
  13.         while (it.hasNext()) {  
  14.             String ele = it.next();  
  15.             if (ele.equals("222"))  
  16.                 list.remove(ele);  
  17.         }  
  18.     }  
  19. }  
此时并没有产生异常,

下面再看一个代码:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.ArrayList;  
  4. import java.util.Iterator;  
  5.   
  6. public class ArrayListRemove {  
  7.     public static void main(String[] args) {  
  8.         ArrayList<String> list = new ArrayList<String>();  
  9.         list.add("111");  
  10.         list.add("222");  
  11.         list.add("333");  
  12.         Iterator<String> it = list.iterator();  
  13.         while (it.hasNext()) {  
  14.             String ele = it.next();  
  15.             if (ele.equals("333"))  
  16.                 list.remove(ele);  
  17.         }  
  18.     }  
  19. }  
此时会产生如下异常:


[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.Iterator;  
  4. import java.util.TreeSet;  
  5.   
  6. public class ArrayListRemove {  
  7.     public static void main(String[] args) {  
  8.         TreeSet<String> set = new TreeSet<String>();  
  9.         set.add("111");  
  10.         set.add("222");  
  11.         set.add("333");  
  12.         Iterator<String> it = set.iterator();  
  13.         while (it.hasNext()) {  
  14.             String ele = it.next();  
  15.             if (ele.equals("333"))  
  16.                 set.remove(ele);  
  17.         }  
  18.     }  
  19. }  
此时并不会产生异常,

再看下面的代码:

[java] view plain copy
 print?在CODE上查看代码片派生到我的代码片
  1. package com.crazyit;  
  2.   
  3. import java.util.Iterator;  
  4. import java.util.TreeSet;  
  5.   
  6. public class ArrayListRemove {  
  7.     public static void main(String[] args) {  
  8.         TreeSet<String> set = new TreeSet<String>();  
  9.         set.add("111");  
  10.         set.add("222");  
  11.         set.add("333");  
  12.         Iterator<String> it = set.iterator();  
  13.         while (it.hasNext()) {  
  14.             String ele = it.next();  
  15.             if (ele.equals("222"))  
  16.                 set.remove(ele);  
  17.         }  
  18.     }  
  19. }  
此时产生如下异常:

总结:

(1)实际上,对于ArrayList、Vector、LinkedList等List集合而言,如果正在遍历倒数第2个集合元素,使用List集合的remove()方法删除集合的任意一个元素并不会发生异常,当正在遍历其他元素时删除其他元素就会发生相关异常。

(2)对于TreeSet、HashSet等Set集合而言,当使用Iterator遍历它们时,如果正在遍历最后一个集合元素时,使用Set集合的remove()方法删除结婚的元素并不会引发异常,但是如果在遍历其他集合元素时删除其他元素,就会引发相关异常。

因为对于List集合,如果在遍历最后第2个元素时执行删除操作,则List调用Iterator对应的hashNext()方法判断已经没有下一个元素了,则不会取next()了。

而对于Set集合,在遍历最后一个元素时,此时遍历操作已经完成,删除Set中元素不会产生任何影响。


from: http://blog.csdn.NET/litianpenghaha/article/details/22575639?utm_source=tuicool&utm_medium=referral

http://blog.csdn.Net/litianpenghaha/article/details/22601041

原文地址:https://www.cnblogs.com/YangtzeYu/p/6216502.html