廖雪峰Java11多线程编程-3高级concurrent包-9Fork_Join

1. Fork/Join模式

线程池可以高效执行大量小任务:

Fork/Join线程池可以执行一种特殊的任务:

  • 把一个大任务拆成多个小任务并行执行
  • Fork/Join是在JDK 1.7引入的

Fork/Join模式的应用:

  • java.util.Arrays.parallelSort(array):方法内部通过Fork/Join对一个大数组进行并行排序,在多核CPU上就可以大大提高排序的速度。

例如:计算一个有1000万个元素数组的和。
如果把一个大数组拆成2个数组,就可以利用双核CPU并行计算,最后把2个结果相加就是最终的结果。

如果拆成2个数组以后,每个数组仍然很大,可以进一步拆分成4个数组,我们就可以让4核CPU并行执行。

Fork/Join就是把一个大任务不断的拆成小任务,执行并行计算的一种模式。

class SumTask extends RecursiveTask<Long> {
    @Override
    protected Long compute(){
        //把一个大任务分拆成2个子任务
        SumTask subtask1 = new Sumtask(...);
        SumTask subtask2 = new Sumtask(...);

        //调用invokeAll()同时运行2个小任务,当2个任务都完成以后,invokeAll才返回
        invokeAll(subtask1, subtask2); 

        //通过join()获得2个子任务的结果
        Long result1 = subtask1.join();
        Long result2 = subtask2.join();

        return result1 + result2; //返回结果
    }
}

使用Fork/Join的关键在于,在compute方法内部,我们需要把一个大任务分拆成2个小任务,然后调用invokeAll()这个方法同时运行2个小任务。
当2个任务都运行结束以后,invokeAll()才会返回。接着,我们调用join()方法获得2个小任务的执行结果,最后把2个结果相加返回。

Recursive可以不断的把自身拆成小任务并行执行

2.示例

1.创建长度为1000的随机数组成的数组,并计算和作为期望值
2.使用SumTask创建一个ForkJoinTask对象。
3.通过ForkJoinPool.commonPool()方法获得一个commonPool(),然后用invoke来执行这个任务
4.求和的任务SumTask继承制RecursiveTask,返回值是Long类型,指定常量是THREHOLD。构造方法是传入一个数组、开始索引、结束索引。
5.SumTask的compute方法:我们首先判断任务是否足够的小。是,就直接进行计算,并且返回计算的结果;否,即继续拆分,这样我们就获得了subtask1,subtask2 这两个子任务。紧接着调用invokeAll()方法,同时执行这两个子任务。然后我们用join()方法获得两个子任务的结果,相加返回。

import java.awt.*;
import java.util.Random;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.ForkJoinTask;
import java.util.concurrent.RecursiveTask;

class SumTask extends RecursiveTask<Long> {//求和的任务继承至RecursiveTask,返回值是Long类型
    //执行常量THRESHOLD,用它来分解任务
    static final int THRESHOLD = 250;
    long[] array;
    int start;
    int end;
    SumTask(long[] array,int start,int end){
        //创建SumTask时,传入一个数组,起始结束位置的索引
        this.array = array;
        this.start = start;
        this.end = end;
    }
    public Long compute(){
        //执行compute方法时,任务足够小,直接计算返回执行的结果
        if(end - start <= THRESHOLD){
            long sum = 0;
            for(int i=start;i<end;i++){
                sum += this.array[i];
                try{
                    Thread.sleep(2);
                }catch (InterruptedException e){}
            }
            return sum;
        }
        //如果任务太大,就一分为二,拆成2个子任务
        int middle = (start + end) / 2;
        System.out.println(String.format("split %d-%d ==> %d~%d ,%d~%d",start,end,start,middle,middle,end));
        SumTask subtask1 = new SumTask(this.array,start,middle);
        SumTask subtaks2 = new SumTask(this.array,middle,end);
        //调用invokeAll同时执行这两个任务
        invokeAll(subtask1,subtaks2);
        //用join获取子任务的结果
        Long subresult1 = subtask1.join();
        Long subresult2 = subtaks2.join();
        Long result = subresult1 + subresult2;
        System.out.println(String.format("result = %d + %d ==> %d",subresult1,subresult2,result));
        return result;
    }
}
public class ForkJoinTaskSample {
    //对一个大数组进行求和
    public static void main(String[] args) throws Exception{
        long[] array = new long[1000]; //创建一个包含1000个元素的数组
        long expectedSum = 0;
        for(int i=0;i<array.length;i++){
            //1.创建数组的过程中,并计算数组的和作为期望值
            array[i] = random();
            expectedSum += array[i];
        }

        System.out.println("expectedSum: "+expectedSum);
        //创建一个ForkJoinTask
        ForkJoinTask<Long> task = new SumTask(array,0,array.length);
        Long startTime = System.currentTimeMillis();
        //通过ForkJoinPool.commonPool获得一个ForkJoinPool,用invoke方法执行这个任务
        Long result = ForkJoinPool.commonPool().invoke(task);
        Long endTime = System.currentTimeMillis();
        System.out.println("Fork/join sum: "+result+" in "+(endTime-startTime));
    }
    static Random random = new Random(0);
    static long random(){
        return random.nextInt(10000);
    }
}

3. 总结:

  • Fork/Join是一种基于分治的算法:分解任务+合并结果
  • Fork/JoinPool线程池可以把一个大任务拆成小任务并行执行
  • 任务类必须继承自RecursiveTask/RecursiveAction。
    * RecursiveTask有返回值;RecursiveAction没有返回值
  • 使用Fork/Join模式可以进行并行计算提高效率
原文地址:https://www.cnblogs.com/csj2018/p/11033148.html