Java ArrayList小记

1.基本用法

　　ArrayList是一个泛型容器，新建ArrayList需要实例化泛型参数，比如:

ArrayList<String> StrList = new ArrayList<>();
ArrayList<Integer> intList = new ArrayList<>();

　　ArrayList的主要方法有：

// 添加元素到末尾
public boolean add(E e)
// 判断是否为空
public boolean isEmpty()
// 获取大小 
public int size() 
// 获取指定位置（索引）的元素
public E get(int index) 
// 查找指定元素，若找到，返回索引位置，否则返回-1
public int indexOf(Object o) 
// 从后往前找
public int lastIndexOf(Object o) 
// 判断是否包含指定元素，根据equals方法的返回值
public boolean contains(Object o) 
// 删除指定位置的元素，返回值为被删除的元素对象
public E remove(int index)
// 删除指定元素，只删除第一个相同的元素，若o为null,则删除值为null的元素
public boolean remove(Object o)
// 清空元素
public void clear()
// 在指定位置插入元素，index为0表示插入最前面，index为ArrayList的长度表示插到最后面
public void add(int index, E element)
// 修改指定位置的元素内容
public E set(int index, E element)

　　简单示例：

ArrayList<String> strList = new ArrayList<>();
strList.add("我爱");
strList.add("编程");
for (int i = 0; i < strList.size(); i++) {
    System.out.println(strList.get(i));
}

2.基本原理

　　ArrayList是基于数组实现的，内部有一个数组elementData，还有一个整数size记录实际的元素个数（基于Java 8），如下所示：

transient Object[] elementData;
private int size;

　　先来看下add和remove方法的实现。add方法的主要代码为：

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

　　首先调用ensureCapacityInternal确保数组容量是够的，ensureCapacityInternal的代码为：

    private void ensureCapacityInternal(int minCapacity) {
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }
    private static int calculateCapacity(Object[] elementData, int minCapacity) {
            if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
                return Math.max(DEFAULT_CAPACITY, minCapacity);
            }
            return minCapacity;
        }
    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

　　首先calculateCapacity方法判断数组是否为空，若为空，则首次至少分配的大小为DEFAULT_CAPACITY（默认为10）。然后调用ensureExplicitCapacity方法，modCount表示内部的修改次数，如果需要的长度大于当前数组的长度，则调用grow方法，其主要代码为：

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        // 右移一位相当于除以2，所以，newCapacity相当于oldCapacity的1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        // 如果扩展1.5倍还是小于minCapacity，就扩展为minCapacity
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        // 确保newCapacity不超过VM允许的最大值
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

　　再来看看remove方法的代码：

    public E remove(int index) {
        // 检查给定索引是否在范围内，若不在抛出运行时异常。
        rangeCheck(index);
        modCount++;
        E oldValue = elementData(index);
        // 计算要移动的元素个数，index后面的都要移动
        int numMoved = size - index - 1;
        if (numMoved > 0)
            // 通过数组copy来移动元素
            System.arraycopy(elementData, index+1, elementData, index, numMoved);
        // 数组最后一位，置为null,完成删除    
        elementData[--size] = null; // clear to let GC do its work
        return oldValue;
    }

　　使用modCount记录修改次数。使用数组拷贝来移动元素，最后将“移动”到末尾的元素设置为null，完成删除。

3.迭代

　　来看下迭代操作的例子，循环打印ArrayList中的每个元素，ArrayList支持foreach语法：

        ArrayList<Integer> list = new ArrayList<>();
        list.addAll(Arrays.asList(9, 5, 6, 7));
        for (Integer i : list) {
            System.out.print(i + " ");
        }
        System.out.println(" ");
        // 或者
        for (int i = 0; i < list.size(); i++) {
            System.out.print(list.get(i) + " ");
        }

　　使用foreach看上去更为简洁，具体选择使用哪种要根据具体情况，如若需要使用索引就不方便使用foreach了。那么这种foreach语法背后是怎么实现的呢？其实，编译器会将它转换为如下代码：

        Iterator<Integer> iterator = list.iterator();
        while (iterator.hasNext()) {
            System.out.println(iterator.next() + " ");
        }

　　ArrayList实现了Iterable接口，Iterable表示可迭代，Java 8中迭代器接口：

public interface Iterable<T> {

    Iterator<T> iterator();
    
    default void forEach(Consumer<? super T> action) {
        Objects.requireNonNull(action);
        for (T t : this) {
            action.accept(t);
        }
    }
    
    default Spliterator<T> spliterator() {
        return Spliterators.spliteratorUnknownSize(iterator(), 0);
    }
}

　　一个抽象方法和两个默认方法，默认方法是java 8新增的，具体使用方式参考API文档。来看下iterator方法，它返回一个实现了Iterator接口的对象，Java 8中Iterator接口的定义为：

public interface Iterator<E> {
    boolean hasNext();

    E next();

    default void remove() {
        throw new UnsupportedOperationException("remove");
    }

    default void forEachRemaining(Consumer<? super E> action) {
        Objects.requireNonNull(action);
        while (hasNext())
            action.accept(next());
    }
}

　　hasNext()判断是否还有下一个元素，next()返回下一个元素，remove()删除最后返回的元素，只读访问的基本模式类似于：

        Iterator<Integer> iterator = list.iterator();
        while (iterator.hasNext()) {
            System.out.println(iterator.next() + " ");
        }

　　只要对象实现了Iterable接口，就可以使用foreach语法，编译器会转换为调用Iterable和Iterator接口的方法。下面来区分下这两个接口：

　　1. Iterable表示对象可以被迭代，它有一个iterator方法，返回Iterator对象，实际通过Iterator接口的方法进行遍历；

　　2. 如果对象实现了Iterable接口，就可以使用foreach语法；

　　3. 类可以不实现Iterable，也可以创建Iterator对象。

　　除了iterator()，ArrayList还提供了两个返回Iterator接口的方法：

public ListIterator<E> listIterator()
public ListIterator<E> listIterator(int index)

　　ListIterator扩展了Iterator接口，增加了一些方法，向前遍历，添加元素，修改元素，返回索引位置等，添加的方法有：

public interface ListIterator<E> extends Iterator<E> {
    boolean hasPrevious();
    E previous();
    int nextIndex();
    int previousIndex();
    void set(E e);
    void add(E e);
}

　　listIterator()方法返回的迭代器从0开始，而listIterator(int index)方法返回的迭代器从指定位置的index开始。比如反向遍历：

    public static void reverseTraverse(List<Integer> list) {
        ListIterator<Integer> it = list.listIterator(list.size());
        while (it.hasPrevious()) {
            System.out.println(it.previous() + " ");
        }
    }

　　关于迭代器，有一种常见的错误使用，就是在迭代的中间调用容器的删除方法。比如如下代码：

    public static void wrongUsage(List<Integer> list) {
        for (Integer x : list) {
            if (x < 20) {
                list.remove(x);
            }
        }
        
        /**
         * java.util.ConcurrentModificationException
         */
    }

　　运行时会抛出上面注释中异常，发生了并发修改异常。由于迭代器内部会维护一些索引位置相关的数据，要求在迭代过程中，容器不能发生结构性变化，否则这些索引位置就失效了。结构性变化指的是添加、插入和删除元素，只是修改元素内容不算结构性变化。那么如何避免异常呢？可以使用迭代器的remove方法：

    public static void remove(ArrayList<Integer> list) {
        Iterator<Integer> it = list.iterator();
        while (it.hasNext()) {
            if (it.next() < 20) {
                it.remove();
            }
        }
    }

　　为什么使用迭代器自己的remove方法不抛出异常呢？来看下ArrayList中iterator方法的实现：

    public Iterator<E> iterator() {
        return new Itr();
    }

　　新建了一个Itr对象，Itr是一个成员内部类，实现了Iterabtor接口，声明为：

    private class Itr implements Iterator<E> {
        // 下一个要返回的元素位置
        int cursor = 0;
        // 最后一个返回的索引位置，如果没有，为-1
        int lastRet = -1;
        // 期望的修改次数
        int expectedModCount = modCount;
        public boolean hasNext() {
            return cursor != size();
        }

        public E next() {
            checkForComodification();
            try {
                int i = cursor;
                E next = get(i);
                lastRet = i;
                cursor = i + 1;
                return next;
            } catch (IndexOutOfBoundsException e) {
                checkForComodification();
                throw new NoSuchElementException();
            }
        }

        public void remove() {
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();

            try {
                // 迭代器的删除调用了外部类的remove,同时又更新了cursor、lastRet和expectedModCountde值，所以它可以正确的删除
                AbstractList.this.remove(lastRet);
                if (lastRet < cursor)
                    cursor--;
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException e) {
                throw new ConcurrentModificationException();
            }
        }

        final void checkForComodification() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }
    }

　　modCount是外部类中当前修改次数，成员内类可以直接访问外部类的实例变量。每次发生结构变化的时候modCount都会增加1，而每次迭代器操作的时候都会检查expectedModCount是否与modCount相等，这样就能检测出结构变化了。在使用迭代器的remove时有一点需要注意，在调用remove之前必须先调用next，否则会抛出java.lang.IllegalStateException 异常，因为直接调用lastRet参数默认为-1，还没被赋值。

　　迭代器表示的是一种关注点分离的思想，将数据的实际组织方式与数据的迭代遍历相分离，是一种常见的设计模式。定义如下：

　　它提供一种方法访问一个容器对象中各个元素，而又不需暴露该对象的内部细节。--迭代器模式

4. ArrayList实现的接口

　　Java的各种容器类有一些共性的操作，这些共性以接口的方式体现，例如Iterable，此外AarrayList还实现了三个主要的接口：Collection、List和RandomAccess接口。

1. Collection

　　Conllection表示一个数据的集合，位置间没有位置或顺序的概念，Java 8中定义的接口为：

public interface Collection<E> extends Iterable<E> {
    // 集合大小
    int size();
    // 判断集合是否为空
    boolean isEmpty();
    // 判断集合是否包含指定元素
    boolean contains(Object o);
    // 迭代器
    Iterator<E> iterator();
    // 转换为数组
    Object[] toArray();
    // 转换为数组并制定返回类型
    <T> T[] toArray(T[] a);
    // 添加元素
    boolean add(E e);
    // 删除指定元素
    boolean remove(Object o);
    // 判断给定集合是否包含在当前集合
    boolean containsAll(Collection<?> c);
    // 将给定集合添加到当前集合中
    boolean addAll(Collection<? extends E> c);
    // 将给定集合的内容从当前集合中移除
    boolean removeAll(Collection<?> c);
    default boolean removeIf(Predicate<? super E> filter) {
        Objects.requireNonNull(filter);
        boolean removed = false;
        final Iterator<E> each = iterator();
        while (each.hasNext()) {
            if (filter.test(each.next())) {
                each.remove();
                removed = true;
            }
        }
        return removed;
    }
    // 判断当前集合中是否包含给定的集合
    boolean retainAll(Collection<?> c);
    // 清空集合
    void clear();
    boolean equals(Object o);
    int hashCode();
    @Override
    default Spliterator<E> spliterator() {
        return Spliterators.spliterator(this, 0);
    }
    default Stream<E> stream() {
        return StreamSupport.stream(spliterator(), false);
    }
    default Stream<E> parallelStream() {
        return StreamSupport.stream(spliterator(), true);
    }
}

　　默认方法略过，可查看API学习。抽象类AbstractCollection对这些方法都提供了默认实现，ArrayList继承了AbstactList，而AbstractList又继承了AbstractCollection，ArrayList对其中的一些方法进行了重写，以提供更高的效率。

2. List

　　List表示有顺序并且可重复的数据集合，它扩展了Collection接口（java 8）：

public interface List<E> extends Collection<E> {

    int size();
    boolean isEmpty();
    boolean contains(Object o);
    Iterator<E> iterator();
    <T> T[] toArray(T[] a);
    boolean add(E e);
    boolean remove(Object o);
    boolean containsAll(Collection<?> c);
    boolean addAll(Collection<? extends E> c);
    boolean addAll(int index, Collection<? extends E> c);
    boolean removeAll(Collection<?> c);
    boolean retainAll(Collection<?> c);
    default void replaceAll(UnaryOperator<E> operator) {
        Objects.requireNonNull(operator);
        final ListIterator<E> li = this.listIterator();
        while (li.hasNext()) {
            li.set(operator.apply(li.next()));
        }
    }
    @SuppressWarnings({"unchecked", "rawtypes"})
    default void sort(Comparator<? super E> c) {
        Object[] a = this.toArray();
        Arrays.sort(a, (Comparator) c);
        ListIterator<E> i = this.listIterator();
        for (Object e : a) {
            i.next();
            i.set((E) e);
        }
    }
    void clear();
    boolean equals(Object o);
    int hashCode();
    E get(int index);
    E set(int index, E element);
    void add(int index, E element);
    E remove(int index);
    int indexOf(Object o);
    int lastIndexOf(Object o);
    ListIterator<E> listIterator();
    ListIterator<E> listIterator(int index);
    List<E> subList(int fromIndex, int toIndex);
    @Override
    default Spliterator<E> spliterator() {
        return Spliterators.spliterator(this, Spliterator.ORDERED);
    }
}

　　默认方法先混个脸熟，其它扩展的几个方法都和位置有关，可根据API文档学习。

3. RandomAccess

　　RandomAccess接口定义如下：

public interface RandomAccess {
}

　　这是一个标记接口，用于声明类的一种属性。实现该接口的类表示可以随机访问，就是具备类似数组那样的特性，数据在内存中是连续存放的，根据索引值就可以直接定位到具体的元素，访问效率很高。根据这个声明，在一些算法代码中可以选择效率更高的实现。比如Collections类中的binarySearch方法：

    public static <T>
    int binarySearch(List<? extends Comparable<? super T>> list, T key) {
        // 这里就根据是否实现了RandomAccess接口选择效率更高的算法
        if (list instanceof RandomAccess || list.size()<BINARYSEARCH_THRESHOLD)
            return Collections.indexedBinarySearch(list, key);
        else
            return Collections.iteratorBinarySearch(list, key);
    }

5. ArrayList特点总结

　　ArrayList内部是采用动态数组实现的：

　　1. 可以随机访问（实现了RandomAccess接口），按照索引位置进行访问效率很高效率为O（1），简单来说就是一步到位。

　　2. 在数组未排序的情况下，查找元素效率比较低，具体是O（N），N为数组内容长度，性能与数组长度成正比。

　　3. 添加元素的效率还可以，但是被重新分配和复制数组的开销被均摊了，添加N个元素的效率为O(N)。

　　4. 插入和删除元素的效率比较低，因为需要复制、移动元素，具体为O(N)。

---------- I love three things in this world. Sun, moon and you. Sun for morning, moon for night , and you forever .