线程池

系统启动一个新线程的成本是比较高的，因为它涉及与操作系统交互。在这种情形下，使用线程池可以很好地提高性能，尤其是当程序中需要创建大量生存期很短暂的线程时，更应该考虑使用线程池。

与数据库连接池类似的是，线程池在系统启动时即创建大量空闲的线程，程序将一个 Runnable 对象或 Callable 对象传给线程池，线程池就会启动一个线程来执行它们的 run() 或 call() 方法，当 run() 或 call() 方法执行结束后，该线程并不会死亡，而是再次返回线程池成为空闲状态，等待执行下一个 Runnable 对象的 run() 或 call() 方法。

除此之外，使用线程池可以有效地控制系统中并发线程的数量，当系统中包含大量并发线程时，会导致系统性能剧烈下降，甚至导致 JVM 崩溃，而线程池的最大线程数参数可以控制系统中并发线程数不超过此数。

Java 8 改进的线程池

在 Java 5 以前，开发者必须手动实现自己的线程池；从 Java 5 开始， Java 内建支持线程池。 Java 5 新增了一个 Executors 工厂类来产生线程池，该工厂类包含如下几个静态工厂方法来创建线程池。

newCachedThreadPool()：创建一个具有缓存功能的线程池，系统根据需要创建线程，这些线程将会被缓存在线程池中。
newFixedThreadPool(int nThreads)：创建一个可重用的、具有固定线程数的线程池。
newSingleThreadExecutor()：创建一个只有单线程的线程池，它相当于调用 newFixedThreadPool() 方法时传入参数为1。
newScheduledThreadPool(int corePoolSize)：创建具有指定线程数的线程池，它可以在指定延迟后执行线程任务。 corePoolSize 指池中所保存的线程数，即使线程是空闲的也被保存在线程池内。
newSingleThreadScheduledExecutor()：创建只有一个线程的线程池，它可以在指定延迟后执行线程任务。
ExecutorService newWorkStealingPool(int parallelism)：创建持有足够的线程的线程池来支持给定的并行级别，该方法还会使用多个队列来减少竞争。
ExecutorService newWorkStealingPool()：该方法是前一个方法的简化版本。如果当前机器有 4 个CPU, 则目标并行级别被设置为 4，也就是相当于为前一个方法传入 4 作为参数。

上面7个方法中的前三个方法返回一个 ExecutorService 对象，该对象代表一个线程池，它可以执行 Runnable 对象或 Callable 对象所代表的线程；而中间两个方法返回一个 ScheduledExecutorService 线程池，它是 ExecutorService 的子类，它可以在指定延迟后执行线程任务；最后两个方法则是 Java 8 新增的，这两个方法可充分利用多 CPU 并行的能力。这两个方法生成的 work stealing 池，都相当于后台线程池，如果所有的前台线程都死亡了，work stealing 池中的线程会自动死亡。

由于目前计算机硬件的发展日新月异，即使普通用户使用的电脑通常也都是多核 CPU，因此 Java 8 在线程支持上也增加了利用多 CPU 并行的能力，这样可以更好地发挥底层硬件的性能。

ExecutorService 代表尽快执行线程的线程池（只要线程池中有空闲线程，就立即执行线程任务），程序只要将一个 Runnable 对象或 Callable 对象（代表线程任务）提交给该线程池，该线程池就会尽快执行该任务。 ExecutorService 里提供了如下三个方法。

Future <?> submit(Runnable task)：将一个 Runnable 对象提交给指定的线程池，线程池将在有空闲线程时执行 Runnable 对象代表的任务。其中 Future 对象代表 Runnable 任务的返回值，但 run() 方法没有返回值，所以 Future 对象将在 run() 方法执行结束后返回 null 。但可以调用 Future 的 isDone()、 isCancelled() 方法来获得 Runnable 对象的执行状态。
<T> Future <T> submit(Runnable task, T result)：将一个 Runnable 对象提交给指定的线程池，线程池将在有空闲线程时执行 Runnable 对象代表的任务。其中 result 显式指定线程执行结束后的返回值，所以 Future 对象将在 run() 方法执行结束后返回 result 。
<T> Future <T> submit(Callable <T> task)：将一个 Callable 对象提交给指定的线程池，线程池将在有空闲线程时执行 Callable 对象代表的任务。其中 Future 代表 Callable 对象里 call() 方法的返回值。

ScheduledExecutorService 代表可在指定延迟后或周期性地执行线程任务的线程池，它提供了如下4个方法。

ScheduledFuture<V> schedule (Callable<V> callable, long delay, TimeUnit unit)：指定 callable 任务将在 delay 延迟后执行。
ScheduledFuture<?> schedule(Runnable command , long delay , TimeUnit unit)：指定 command 任务将在 delay 延迟后执行。
ScheduledFuture<?> scheduleAtFixedRate(Runnable command, long initialDelay, long period , TimeUnit unit) : 指定 command 任务将在 delay 延迟后执行，而且以设定频率重复执行。也就是说，在 initialDelay 后开始执行，依次在 initialDelay + period 、 initialDelay +2* period …处重复执行，依此类推。
ScheduledFuture<?> scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit)：创建并执行一个在给定初始延迟后首次启用的定期操作，随后在每一次执行终止和下一次执行开始之间都存在给定的延迟。如果任务在任一次执行时遇到异常，就会取消后续执行；否则，只能通过程序来显式取消或终止该任务。

用完一个线程池后，应该调用该线程池的 shutdown() 方法，该方法将启动线程池的关闭序列，调用 shutdown() 方法后的线程池不再接收新任务，但会将以前所有已提交任务执行完成。当线程池中的所有任务都执行完成后，池中的所有线程都会死亡；另外也可以调用线程池的 shutdownNow() 方法来关闭线程池，该方法试图停止所有正在执行的活动任务，暂停处理正在等待的任务，并返回等待执行的任务列表。

使用线程池来执行线程任务的步骤如下。

调用 Executors 类的静态工厂方法创建一个 ExecutorService 对象，该对象代表一个线程池。
创建 Runnable 实现类或 Callable 实现类的实例，作为线程执行任务。
调用 ExecutorService 对象的 submit() 方法来提交 Runnable 实例或 Callable 实例。
当不想提交任何任务时，调用 ExecutorService 对象的 shutdown() 方法来关闭线程池。

下面程序使用线程池来执行指定 Runnable 对象所代表的任务。

//实现Runnable接口来定义一个简单的
class TestThread implements Runnable{
    public void run(){
        for (int i = 0; i < 100 ; i++ ){
            System.out.println(Thread.currentThread().getName()
                + "的i值为:" + i);
        }
    }
}

public class ThreadPoolTest{
    public static void main(String[] args) {
        //创建一个具有固定线程数（6）的线程池
        ExecutorService pool = Executors.newFixedThreadPool(6);
        //向线程池中提交2个线程
        pool.submit(new TestThread());
        pool.submit(new TestThread());
        //关闭线程池
        pool.shutdown();
    }
}

上面程序中创建 Runnable 实现类与最开始创建线程池并没有太大差别，创建了 Runnable 实现类之后程序没有直接创建线程、启动线程来执行该 Runnable 任务，而是通过线程池来执行该任务，使用线程池来执行 Runnable 任务的代码如程序中粗体字代码所示。运行上面程序，将看到两个线程交替执行的效果，如下图所示。

Java 8 增强的 ForkJoinPool

现在计算机大多已向多 CPU 方向发展，即使普通 PC ，甚至小型智能设备（如手机）、多核处理器也已被广泛应用。在未来的日子里，处理器的核心数将会发展到更多。

虽然硬件上的多核 CPU 已经十分成熟，但很多应用程序并未为这种多核 CPU 做好准备，因此并不能很好地利用多核 CPU 的性能优势。

为了充分利用多 CPU 、多核 CPU 的性能优势，计算机软件系统应该可以充分“挖掘”每个 CPU 的计算能力，绝不能让某个 CPU 处于“空闲”状态。为了充分利用多 CPU 、多核 CPU 的优势，可以考虑把一个任务拆分成多个“小任务”，把多个“小任务”放到多个处理器核心上并行执行；当多个“小任务”执行完成之后，再将这些执行结果合并起来即可。

Java 7 提供了 ForkJoinPool 来支持将一个任务拆分成多个“小任务”并行计算，再把多个“小任务”的结果合并成总的计算结果。 ForkJoinPool 是 ExecutorService 的实现类，因此是一种特殊的线程池。ForkJoinPool 提供了如下两个常用的构造器。

ForkJoinPool(int parallelism)：创建一个包含 parallelism 个并行线程的 ForkJoinPool 。
ForkJoinPool()：以 Runtime.availableProcessors() 方法的返回值作为 parallelism 参数来创建 ForkJoinPool

Java 8 进一步扩展了 ForkJoinPool 的功能，Java 8 为 ForkJoinPool 增加了通用池功能。 ForkJoinPool 类通过如下两个静态方法提供通用池功能。

ForkJoinPool commonPool()：该方法返回一个通用池，通用池的运行状态不会受 shutdown() 或 shutdownNow() 方法的影响。当然，如果程序直接执行 System.exit(0); 来终止虚拟机，通用池以及通用池中正在执行的任务都会被自动终止。
int getCommonPoolParallelism()：该方法返回通用池的并行级别。

创建了 ForkJoinPool 实例之后，就可调用 ForkJoinPool 的 submit(ForkJoinTask task) 或 invoke(ForkJoinTask task) 方法来执行指定任务了。其中 ForkJoinTask 代表一个可以并行、合并的任务。ForkJoinTask 是一个抽象类，它还有两个抽象子类： RecursiveAction 和 RecursiveTask 。其中 RecursiveTask 代表有返回值的任务，而 RecursiveAction 代表没有返回值的任务。

下面以执行没有返回值的“大任务”（简单地打印0〜300的数值）为例，程序将一个“大任务”拆分成多个“小任务”，并将任务交给 ForkJoinPool 来执行。

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveAction;
import java.util.concurrent.TimeUnit;

class PrintTask extends RecursiveAction{
    // 每个“小任务”最多只打印50个数
    private static final int THRESHOLD = 50;
    private int start;
    private int end;
    
    // 打印从 start 到 end 的任务
    public PrintTask(int start, int end) {
        this.start = start;
        this.end = end;
    }
    
    @Override
    protected void compute() {
        // 当 end 与 start 之间的差小于 THRESHOLD 时，开始打印
        if(end-start<THRESHOLD) {
            for(int i=start;i<end;i++) {
                System.out.println(Thread.currentThread().getName()+"的 i 值："+i);
            }
        }else {
            // 当 end 与 start 之间的差大于 THRESHOLD 时，即要打印的数超过50个时
            // 将大任务分解成两个“小任务”
            int middle = (start+end)/2;
            PrintTask left = new PrintTask(start, middle);
            PrintTask right = new PrintTask(middle, end);
            // 并行执行两个“小任务”
            left.fork();
            right.fork();
        }
    }
}

public class ForkJoinPoolTest {
    public static void main(String[] args) throws Exception {
        ForkJoinPool pool = new ForkJoinPool();
        // 提交可分解的 PrintTask 任务
        pool.submit(new PrintTask(0, 300));
        pool.awaitTermination(2, TimeUnit.SECONDS);
        // 关闭线程池
        pool.shutdown();
    }
}

上面程序中的粗体字代码实现了对指定打印任务的分解，分解后的任务分别调用 fork() 方法开始并行执行。运行上面程序，可以看到如下图所示的结果。

从如上图所示的执行结果来看， ForkJoinPool 启动了 4个线程来执行这个打印任务——这是因为测试计算机的 CPU 是4核的。不仅如此，读者可以看到程序虽然打印了 0〜299这300个数字，但并不是连续打印的，这是因为程序将这个打印任务进行了分解，分解后的任务会并行执行，所以不会按顺序从0打印到299。

上面定义的任务是一个没有返回值的打印任务，如果大任务是有返回值的任务，则可以让任务继承 RecursiveTask<T>，其中泛型参数 T 就代表了该任务的返回值类型。下面程序示范了使用 RecursiveTask 对一个长度为100的数组的元素值进行累加。

package com.jwen.demo4;

import java.util.Random;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.Future;
import java.util.concurrent.RecursiveTask;
import java.util.function.Function;

class CalTask extends RecursiveTask<Integer>{

    
    // 每个“小任务”最多只累加20个数
    private static final int THRESHOLD = 20;
    private int arr[];
    private int start;
    private int end;
    // 累加从 start 到 end 的数组元素
    public CalTask(int[] arr, int start, int end) {
        this.arr = arr;
        this.start = start;
        this.end = end;
    }
    
    @Override
    protected Integer compute() {
        int sum = 0;
        // 当 end 与 start 之间的差小于 THRESHOLD 时，开始进行实际累加
        if(end-start<THRESHOLD) {
            for(int i=start;i<end;i++) {
                sum+=arr[i];
            }
            return sum;
        }else {
            // 当 end 与 start 之间的差大于 THRESHOLD 时，即要累加的数超过20个时
            // 将大任务分解成两个“小任务”
            int middle = (start+end)/2;
            CalTask left = new CalTask(arr, start, middle);
            CalTask right = new CalTask(arr, middle, end);
            // 并行执行两个“小任务”
            left.fork();
            right.fork();
            // 把两个“小任务”累加的结果合并起来
            return left.join()+right.join(); // ①
        }
    }
}

public class Sum {
    public static void main(String[] args) throws Exception{
        int[] arr = new int[100];
        Random rand = new Random();
        int total = 0;
        // 初始化100个数字元素
        for(int i=0,len = arr.length;i<len;i++) {
            int tmp = rand.nextInt(20);
            // 对数组元素赋值，并将数组元素的值添加到 sum 总和中
            total +=(arr[i]=tmp);
        }
        System.out.println(total);
        // 创建一个通用池
        ForkJoinPool pool = ForkJoinPool.commonPool();
        // 提交可分解的 CalTask 任务
        Future<Integer> future  = pool.submit(new CalTask(arr, 0, arr.length));
        System.out.println(future.get());
        // 关闭线程池
        pool.shutdown();
    }
}

上面程序与前一个程序基本相似，同样是将任务进行了分解，并调用分解后的任务的 fork() 方法使它们并行执行。与前一个程序不同的是，现在任务是带返回值的，因此程序还在①号代码处将两个分解后的“小任务”的返回值进行了合并。

运行上面程序，将可以看到程序通过 CalTask 计算出来的总和，与初始化数组元素时统计出来的总和总是相等，这表明程序一切正常。

Java 的确是一门非常优秀的编程语言，在多 CPU、多核 CPU 时代来到时，Java 语言的多线程已经为多核 CPU 做好了准备。