Collection(List & Set)

一、数组VS集合

1.长度

  数组长度固定;集合长度可变;

2.内容

  数组存储的是同一类型元素;集合可以存储不同类型的元素;

3.元素的数据类型

  数组可以存储基本数据类型,也可以存储引用类型;集合只能存储引用类型(基本数据类型会自动装箱成对象)

二、Collection体系

 Collection基础功能:boolean add(Object obj); boolean addAll(Collection c);

1.添加
boolean add(Object obj);
boolean addAll(Collection c);
2.删除
void clear();
boolean remove(Object);
boolean removeAll(Collection c);//移出一个集合的元素,只要一个元素被移除了就返回true
3.判断
boolean contains(Object o);
boolean containsAll(Collection c);
boolean isEmpty();
4.获取
Iterator<E> iterator();//迭代器
5.长度
int size();
6.交集
boolean retainAll(Collection c);//只保留两集合交集,返回当前集合是否改变过

三、迭代器如何实现

  Collection继承Iterable,实现Iterable中iterator()方法,Iterable中iterator方法只是声明了一下,未具体展开。

public interface Collection<E> extends Iterable<E> {
  Iterator<E> iterator();
}

  Iterator也是一个接口,有四个方法,依然不具体。

public interface Iterator<E> {
    boolean hasNext();
    E next();
    default void remove() {
        throw new UnsupportedOperationException("remove");
    }
    default void forEachRemaining(Consumer<? super E> action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

  找底层实现--ArrayList,发现Iterator是以内部类的方式完成的

    /**
     * An optimized version of AbstractList.Itr
     */
    private class Itr implements Iterator<E> {
        int cursor;       // index of next element to return
        int lastRet = -1; // index of last element returned; -1 if no such
        int expectedModCount = modCount;

        public boolean hasNext() {
            return cursor != size;
        }

        @SuppressWarnings("unchecked")
        public E next() {
            checkForComodification();
            int i = cursor;
            if (i >= size)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }

        public void remove() {
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();

            try {
                ArrayList.this.remove(lastRet);
                cursor = lastRet;
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }

        @Override
        @SuppressWarnings("unchecked")
        public void forEachRemaining(Consumer<? super E> consumer) {
            Objects.requireNonNull(consumer);
            final int size = ArrayList.this.size;
            int i = cursor;
            if (i >= size) {
                return;
            }
            final Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length) {
                throw new ConcurrentModificationException();
            }
            while (i != size && modCount == expectedModCount) {
                consumer.accept((E) elementData[i++]);
            }
            // update once at end of iteration to reduce heap write traffic
            cursor = i;
            lastRet = i - 1;
            checkForComodification();
        }

        final void checkForComodification() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }
    }

     在ArrayList类创建迭代器之后,除非通过迭代器自身remove或add对列表结构进行修改,否则在其他线程中以任何形式对列表进行修改,迭代器马上会抛出异常,快速失败。 

  各种集合遍历方式比较

四、List集合 - 有序存储(存储顺序和取出顺序一致),可重复

1.ArrayList

底层结构是数组,线程不安全

1.1 默认属性

//初始容量为10
private static final int DEFAULT_CAPACITY = 10;
//用户指定该ArrayList容量为0时,返回该空数组
private static final Object[] EMPTY_ELEMENTDATA = {};
//当ArrayList容器为0时,返回该默认空数组。当调用无参构造方法,返回的是该数组。刚创建一个ArrayList 时其内数据量为0。
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
 * 保存添加到ArrayList中的元素。
 * ArrayList的容量就是该数组的长度。
 * 该值为DEFAULTCAPACITY_EMPTY_ELEMENTDATA 时,当第一次添加元素进入ArrayList中时,数组将扩容值DEFAULT_CAPACITY。
 * 被标记为transient,在对象被序列化的时候不会被序列化。
* 从这就可以看出ArrayList底层是一个数组
* 思考:elementData被标记为transient,那么它的序列化和反序列化是如何实现的呢?
* ArrayList自定义了它的序列化和反序列化方式。详情请查看writeObject(java.io.ObjectOutputStream s)和readObject(java.io.ObjectOutputStream s)方法。
*/ transient Object[] elementData; //实际大小,逻辑长度并不是数组长度 private int size;

1.2 构造方法

1.2.1 无参ArrayList,默认指向的都是同一个Object数组。

  如果构造多个无参

public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

1.2.2 指定容量

 /**
 * 构造一个指定初始化容量为capacity的空ArrayList。
 *
 * @param  initialCapacity  ArrayList的指定初始化容量
 * @throws IllegalArgumentException  如果ArrayList的指定初始化容量为负。
 */ 
public ArrayList(int initialCapacity) { 
    if (initialCapacity > 0) { 
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
         this.elementData = EMPTY_ELEMENTDATA; 
    } else {
         throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    } 
}           

1.2.3 指定元素

public ArrayList(Collection<? extends E> c) {
    elementData = c.toArray();
    if ((size = elementData.length) != 0) {
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    } else {
        // 如果size为0,可认为用户指定容量为0.
this.elementData = EMPTY_ELEMENTDATA; } }

1.3 方法

1.3.1 get(index)  O(1)

public E get(int index) {
    //越界检查
    rangeCheck(index);
    return elementData(index);
}
//越界检查
private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
//返回索引为index的元素
E elementData(int index) {
    return (E) elementData[index];
}

1.3.2 add(E e)

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}
//数组容量检查,不够则扩容 minCapacity:想要的最小容量
private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }
    ensureExplicitCapacity(minCapacity); 
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    //确保指定的最小容量大于当前数组缓冲区长度
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}
//扩容
private void grow(int minCapacity) {
    // overflow-conscious code
    // 获取当前数组的容量
    int oldCapacity = elementData.length;
    //扩容1.5倍
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    //如果扩容后的容量还是小于想要的最小容量,直接扩容到想要的容量
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity      
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        //如果扩容后的容量大于临界值,则进行大容量分配
        newCapacity = hugeCapacity(minCapacity);
     // minCapacity is usually close to size, so this is a win:
     elementData = Arrays.copyOf(elementData, newCapacity);
}
//大容量分配,
private static int hugeCapacity(int minCapacity) {
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE;
}

//扩容大体步骤
/**
1. 进行空间检查,决定是否进行扩容,以及确定最少需要的容量
2. 如果确定扩容,就执行grow(int minCapacity),minCapacity为最少需要的容量
3. 第一次扩容,逻辑为newCapacity = oldCapacity + (oldCapacity >> 1);即在原有的容量基础上增加一半。
4. 第一次扩容后,如果容量还是小于minCapacity,就将容量扩充为minCapacity。
5. 对扩容后的容量进行判断,如果大于允许的最大容量MAX_ARRAY_SIZE,则将容量再次调整为MAX_ARRAY_SIZE。至此扩容操作结束。
*/

1.3.3 add(int index, E element)

public void add(int index, E element) {
  //1.越界检查 rangeCheckForAdd(index);
  //2.确认list容量 ensureCapacityInternal(size
+ 1); // Increments modCount!
  //3.
对数组进行复制处理,目的就是空出index的位置插入element,并将index后的元素位移一个位置    System.arraycopy(elementData, index, elementData, index + 1, size - index);
  //4.插入元素 elementData[index]
= element; size++; }

1.3.4 remove(int index)

public E remove(int index) {
    //越界检查 
    rangeCheck(index);
    //修改次数+1
    modCount++;
    //记录索引为inde处的元素
    E oldValue = elementData(index);
    // 删除指定元素后,需要左移的元素个数
    int numMoved = size - index - 1;
     //如果有需要左移的元素,就移动(移动后,该删除的元素就已经被覆盖了)
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index, numMoved);
    //size-1,末尾元素置为null
    elementData[--size] = null; // clear to let GC do its work
    return oldValue;
}

2.LinkedList

  底层数据结构是双向链表,线程不安全。可以使用LinkedList实现队列或者栈。

private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

3.Vector

  底层数据结构是数组,线程安全,方法被Synchronized修饰。如果需要ArrayList实现同步可以使用Collections.synchronized(new ArrayList(...))的方法,实现同步。

  Vector每次扩容直接扩展一倍

五、Set集合-无序,元素不可重复

1.HashSet

 底层数据结构是哈希表+红黑树。实现Set接口、不保证迭代顺序、允许元素为null、底层实际上是一个HashMap实、非同步、初始容量非常影响迭代性能。

1.1 构造方法-无参

private transient HashMap<E,Object> map;
//由此可以看出底层使用hashmap实现的;
public HashSet() {
    map = new HashMap<>();
}

1.2 既然底层实用hashmap实现的,那么键值对分别对应的是什么呢?

//HashSet底层使用hashmap实现,键:我们操作的元素,即集合中的数据,值:为同一个Object对象
private static final Object PRESENT = new Object();

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}

public boolean contains(Object o) {
    return map.containsKey(o);
}

图示:

  

2.TreeSet

   底层数据结构是红黑树,保证元素的排序方式。

  • 实现NavigableSet接口

  • 可以实现排序功能

  • 底层实际上是一个TreeMap实例

  • 非同步

  • 不允许为null

3.LinkedHashSet

  • 迭代是有序的

  • 底层实际上是一个HashMap+双向链表实例(其实就是LinkedHashMap)…

  • 非同步

  • 性能比HashSet差一丢丢,因为要维护一个双向链表

  • 初始容量与迭代无关,LinkedHashSet迭代的是双向链表

  • 允许为null
原文地址:https://www.cnblogs.com/qmillet/p/12495448.html