集合常见知识总结

集合知识总结：

　　首先要明确为什么引进了集合这个概念。相对于数组来说，集合有什么不同或相同。数组是用来存储数据的，并且是同一类型的数据，且定义好了之后长度就固定了，每个元素都可以通过索引来查找，带来了许多方便。但是有时候我们存数据时，就没有那么多顾虑就会存储一些很杂并非一类型的数据，并且要存储多少我们事先也不能确定，那这时候数组就不能满足我们的使用了。所以就有集合的存在。可以知道集合能存各种类型，任意长度。接下来就纤细了解一下集合：

　　集合中也分了几种情况：元素能否重复、是否允许为空、是否有序。当然重复与否的话就用equals方法来比较，区别于‘==’比较地址的方式。鉴于这种情况下就将集合分为（三个核心接口）：

Set集合：无序，不重复。
List集合：有序，可重复。
Map集合：键值对的方式，键唯一，值可重复。

在Set、List集合之上，定义接口Collection，用于定义存取Set和List类型容器中的对象的一些通用的操作。比如：增加、删除、遍历等。

一、List集合：

　　继承接口Collection接口，有序、支持重复元素、允许为null、可通过索引访问元素。最常用的实现类就是ArrayList和LikedList为最常见两种。

ArrayList在概念上与数组相似，表示一组编入索引的元素，区别在于ArrayList没有预定的长度大小，其长度可按需要增加。其中有一些最常见的方法比如：

add(index,Object o)在列表指定的位置插入对象
get(int index)返回列表中指定位置的对象
set(index,Object o)用指定对象去替换列表中指定位置的对象
remove(int index)删除列表中指定位置的对象等等

　　这里引入了一个新的概念：泛型。意思就是，我们知道集合是包含所有类型的，那么我们就像它只存一种类型这时怎么办？那么就用泛型来约束他。那为什么集合是存的所有类型对象呢？原因是：当我们把对象放入集合中的时候，集合瞬间就会高冷的忘了你是哪种类型了，当你去取的时候他就会为你把该对象编译成object类型了(当然运行时是没有变化的)。那为什么集合会这样高冷健忘呢？是因为:Java程序员在设计时他不知道你会用来存什么数据，所以就为了通用性，就设计成object类型了，可以保存任何对象。

　　另外泛型也是为了解决当你从集合中取出来后要进行强转的麻烦事。用了泛型约束了它，取出来也就不需要强转了。怎么感觉没有泛型的集合也是“无状态的了”。泛型使用方式如：

　　public interface Colletion<E> extends Iterractor<E>;

　　public interface Set<E> extends Colletion<E>;

　　public interface List<E> extends Colletion<E>;

　　其中E就是你要输入的类型。这就是泛型的使用方式。

　　这里还有一个值得注意的地方就是equals方法的使用，用于比较两个对象是否为相同的对象。比较的是内容。

LikedList：也是List接口的常见实现类，它是实现双向链表功能的列表，而且每个列表中还保存着有上一个和下一个链接的索引。其中常见的方法有：

addFirst(Object o):链表开头添加一个对象。
addLast(Object o):链表结尾添加一个对象。
getFirst():返回第一个元素。
getLast():返回最后一个元素。
removeFirst():删除链表中的第一个元素。
removeLast():删除链表中最后一个元素。

　　LikedList和ArrayList的比较：

ArrayList是采用数组的存储机制，有连续位置可以索引，那么在删除和插入操作时就非常的麻烦了。比如：你无论是删除还是插入一个元素进去，都会影响它固有的元素位置。
LikedList是链表形式的，不支持快速查询，要查询的话必须是从头开始来找，异常麻烦并且很慢。但是删除插入就很快了，它不会像ArrayList那样又要排序一次。
所以，一般情况下，ArrayList用于查询，LikedList用于删除和插入。

二，Set集合：

　　首先这个集合也是继承自Collection接口，同时也继承了Collection接口的全部方法。其特点如下：

Set类型容器中不能包含重复元素，当你加入一个新的元素时要进行比较，用重写equals方法的方式进行比较，来判断是否是重复元素。
元素可能没有顺序，也可能有顺序。
由于可能存在没有顺序的可能，所以就不能基于索引访问Set集合中的元素。
最常用的集合是：HashSet和TreeSet两种。

1.HashSet：

　　是基于哈希算法的set接口实现，有如下一些特点：

当遍历HashSet集合时，其中的元素是没有顺序的。
其中不允许重复元素的出现，要重写equals方法来判断是否重复。这里的重复是指相同的哈希码，并且调用equals方法比较时返回为true的两个元素对象。
允许包含null元素。

上述提到遍历这个概念，那么遍历的使用形式是怎样的——用foreach循环遍历HashSet中的对象，语法格式是：for(类型:集合);

当然我们还需要明确一点的就是当在比较HashSet中元素是否为同一元素时，我们仅仅是重写equals方法是不完善的，不足以来判断两元素是否为完全相同的元素。那么我们如何完善这种比较机制呢？

　　如果我们编写的类重新定义了equals方法，那么这个类也必须重新定义hashCode方法，并且保证当两个对象用equals方法比较结果为true时，这两个对象的hashCode方法的返回值为相等。

　　说到这里大概还是不懂为什么就必须得重写equals和hashCode这两个方法才能来准确判断呢？

我们要理解HashSet的存储机制，在基于哈希算法的集合类（包括hashCode、HashMap、HashTable等）中，每个能储存元素的位置称为：‘桶’，一个桶中能装很多元素，而桶的位置由hashCode算法计算而来的哈希码值来决定的。不同的哈希码值的对象存放在桶不同的桶中，一个桶中的多个对象具有相同的哈希码值，因此我们重写hashCode方法只是来找到了桶的位置，调用equals方法来进行对桶中的元素判断比较，返回true才能说这两个对象是相同的对象。

　　所以我们得到一个结论：当我们要将对象添加到HashSet、HashMap、Hashtable等基于哈希算法的集合类中时，必须同时重写hashCode和equals方法才能准确判断对象是否为同一对象。不同时重写两方法的话就不能准确比较。

2.TreeSet：

　　TreeSet不仅实现Set集合，还实现了SortedSet接口的，从而保证了集合中的对象是按照一定的顺序来排序的。当向TreeSet集合中添加一个对象时，会把它插入到有序的对象序列中。但是这种排序并不是按照对象添加的顺序排序的，而是按照一定的算法来排序的。其中TreeSet集合中也有一些独有的方法比如：

first();返回TreeSet中第一个元素。
last();返回TreeSet集合中最后一个元素。
pollFirst();获取并删除第一个元素。
pollLast();获取并删除最后一个元素。
higher(Object o);返回此集合中严格大于给定元素的最小元素。集合最小的元素都要比给定的大才能满足。
lower(Object o);返回此集合中严格小于给定元素的最大元素。集合中最大的元素都要比给定元素小才能满足。
headSet(Object o);返回集合的部分视图，其元素严格小于指定元素o。
tailSet(Object o);返回集合的部分视图，其元素严格大于制定元素o。

那么我们得明白该集合是使用了什么方式来进行排序的？TreeSet使用元素的自然排序进行排序的，或者根据创建set时提供的Comparator进行排序，具体取决于使用的构造方法。也就是说，TreeSet支持自然排序和自定义排序两种排序方式。默认情况下TreeSet是使用自然排序方式。

　　注意：这里的TreeSet不是调用它自己的comparaeTo()方法，而是调用集合中对象的comparaeTo()方法。TreeSet类本身并没有实现Comparable接口。

　　1.是实现的Comparable接口来进行排序的，里面有一个comparaeTo(Object o)的方法，返回整型数据，对于x.comparaTo(y)：

=0,x=y。
>0,x>y。
<0,x<y。

对于JDK常用类，例如：Double、Integer、Long、Short、Float等，是按照数字的大小排序的。
Character类，按照Unicode值的数字大小进行排序。
String对象，按照字符串中字符的Unicode值排序。
注意：使用自然排序时，只能向集合中加入同类型的对象，并且这些对象的类必须实现了Comparable接口，否则程序会抛出异常。

　　2.TreeSet的自定义排序是实现Comparator接口，通过调用compare(Object o1,Object o2)方法，进行两参数的比较：

返回-1则：o1<o2
返回0则：o1=o2
返回1则：o1>o2
当然我们也可以重写让它按照我们的方式排列。

( 这种比较的机制在我们实际运用中非常重要的，面试时也有许多面试官青睐与这个知识点。)

三，Map集合：

　　Map映射集合是java集合框架中，不同于Collection接口的另一个重要接口。它对应的是一种从键(Key)到值（value）的对应关系的集合。也就是说，map类型的集合对象容器中保存着两组对象，一组对象用于保存Map里的key，另外一组用于保存value。key和value可以是任何引用类型的数据。其中key不能重复，但是value可以重复。这两者存在着单向的一对一的关系，即通过key可以找到与之对应的唯一的value值。Map接口定义了Map集合所共有的方法，这些方法分为三类：基本操作、批量操作、Collection视角操作。Collection视角操作提供了将map转化为Collection的手段。

基本操作：

get(Object key);返回与指定键相关的值
put(Object key,Object value);向该映射中添加键值对
remove(Object o);从映射中删除包含指定的键的键值对
containsKey(Object key);如果该映射包含key值，则返回true
containsValue(Object value);如果该映射包含value值，则返回true
size();返回该映射对象中包含的键值对映射关系数
isEmpty();如果该映射为空，则返回为true

批量操作：

clear();删除映射内所有元素。
putAll(Map m);将指定映射中所有映射关系复制到此映射中。

Colletion视角操作：

keySet();返回一个包含映射中所有的Key的Set对象。
values();返回一个包含映射中所有的value的Collection对象。
entrySet();返回一个包含该Map中所有条目的Set对象，条目由内部接口Entry定义。

HashMap和TreeMap是常见的实现类，其中HashMap是基于哈希算法的，要保证存储的唯一性，也需要重写hashCode和equals方法来进行判断，HashMap是没有顺序的。要想有顺序就用TreeMap。TreeMap是基于红黑二叉树算法的Map接口实现，键的排序也分为自然排序和自定义排序两种。

四，工具类Collections和Arrays两种：

　　 Colletions是集合框架用来操作Set、Map、List集合的工具类，用于对集合的排序、查询、修改等操作。这些方法都是静态的直接可以调用的。由于现在的集合都是线程不安全的所以，Collections中就提供了一些方法来改变这种性质，如：

synchronizedCollection（Collection c）：返回一个线程安全的Collection
synchronizedList（List list）：返回一个线程安全的List集合，同理SetMap都是如此。

　　Arrays工具类就是提供了用于操作数组的，比如排序和搜索。

五，古老的集合类与接口：

　　Vector与ArrayList的用法几乎完全相同，二者最大的区别在于Vector类是线程安全的而ArrayList是线程不安全的，所以效率上要比ArrayList要低些。如果在实际运用中如果不考虑此线程安全的问题的话，那么就选用ArrayList使用。

　　Hashtable与HashMap的用法也几乎一样，二者关系如上述两者关系非常相似。还有一个不同点就是Hashtable不允许Key和value值为空，而HashMap是允许的。

　　总结新老集合的性质，老的集合都是线程安全的，新的集合都是线程不安全的。那么这时候就要调用Collections中线程安全的方法来实现线程安全的机制。

　　Hashtable中还有一个子类properties，也是这四个集合中到现在还被使用频繁的一个类。该类适用于处理属性文件，所谓处理属性文件就是将Map形式的键/值对数据存在一个扩展名为“Properties”的文本文件中，常用作软件的配置文件。例如jdbc.properties文件用于配置JDBC链接到MySql数据库所需的信息。

　　properties类的主要方法：

String getProperty(String key);根据属性的键key获取属性对应的值
String getPriperty(String key,String defaultValue);根据属性的key获取属性的值，如果没有该key值，则返回默认值。
Object setProperty(String key,String value);设置属性
void load(InputStream in);从输出流中装载全部属性。
void store(OutputStream out，String comments);降属性内容通过输出流输出。

　　Enumeration接口是JDK1.0就出现的最古老的遍历器，用于遍历Vector、Stack、Hashtable、Properties等JDK1.0遗留下来的集合类，该接口只有两个方法：

boolean hashMoreElement();测试集合中是否还有更多的元素。如果有返回true。
Object nextElement();返回下一个元素。

　　集合的知识就总结到这里了，其中总结出来的这些都是平时使用过程中应该注意个掌握的。其中古老的集合与现在的集合也是经常会被面试官喜欢问的问题，意图就是考察你是否全面的掌握集合的相关知识。还有properties类的那些方法会在配置文件时用到，就如封装JDBC时就用到了。

　　今天是进入公司的第二天，感触很多，做的项目比以往接触到的项目都要大得多数据复杂得多。同时自己感觉心里也很着急，成天坐在那里翻来覆去的看，依然没什么头绪，好不容易有点头绪了，但是还是不能做点什么，内心很焦急。想起一句话：人这一生或许要经历许多的不同以往经历的第一次。既然是没经历过的，肯定就会有挑战，有挑战才会有收获。持之以恒，静下心来，越困难就代表收获越大。以积极的态度去面对，以最适合的方法克服困难。不能浪费掉这样好的成长机会。努力、坚持......