Java 8新特性之 并行和并行数组(八恶人-8)

Jody Domingre 多莫歌·乔迪

“How you doing, dummy?” 你还好吗,傻瓜 

 

一、基本介绍

  Java8不仅增加了Stream,而且还增加了parallelStream(并行流)。除并行流外,对于普通数组,Java8提供了也简单的并行功能。数组排序,一般使用Arrays.sort()方法串行排序,Java8新增方法Arrays.parallelSort()并行排序。

二、使用

1、parallelSort()

  Java 8新增加了很多方法支持并行的数组处理。最重要的大概是parallelSort()这个方法显著地使排序在多核计算机上速度加快。下面的小例子演示了这个新的方法(parallelXXX)的行为。

  这一小段代码使用parallelSetAll() t方法填充这个长度是2000的数组,然后使用parallelSort() 排序。这个程序输出了排序前和排序后的10个数字来验证数组真的已经被排序了。示例可能的输出如下(请注意这些数字是随机产生的)

import java.util.Arrays;
import java.util.concurrent.ThreadLocalRandom;
 
public class ParallelArrays {
    public static void main( String[] args ) {
        long[] arrayOfLong = new long [ 20000 ];       
 
        Arrays.parallelSetAll( arrayOfLong,
            index -> ThreadLocalRandom.current().nextInt( 1000000 ) );
        Arrays.stream( arrayOfLong ).limit( 10 ).forEach(
            i -> System.out.print( i + " " ) );
        System.out.println();
 
        Arrays.parallelSort( arrayOfLong );
        Arrays.stream( arrayOfLong ).limit( 10 ).forEach(
            i -> System.out.print( i + " " ) );
        System.out.println();
    }
}

2、并行流使用

Map<Boolean, List<Integer>> groupByPrimary = numbers //根据特定的条件(比如:素数和非素数)对数组进行分组
  .parallelStream().collect(Collectors.groupingBy(s -> Utility.isPrime(s)));
Integer[]  prims = numbers.parallelStream().filter(s -> Utility.isPrime(s)) //对数组进行过滤
    .toArray();

三、性能测试

它的性能如何?

为了测试这些并行操作API的性能, 我在两种情况(低竞争和高竞争)下进行了实验。原因是单独运行一个多核算法,往往会有好的性能,但在真实的服务器环境中运行,情况就完全不同了。真实环境中往往有大量的线程在竞争宝贵的CPU时间片以处理消息或用户请求,由于竞争的存在,程序的性能就降低了。所以我进行了接下来的测试。我首先随机生成了长度为100K的整数数组,这些整数的取值在0到1百万之间。然后我分别使用传统的顺序方法和新的Java 8的并行API对这个数组进行了排序,分组和过滤。结果并不使人惊讶。

  • 快速排序快了4.7
  • 分组快了5
  • 过滤快了5.5

这可以说明java 8的并行API具有非常好的性能吗?很不幸,不能。
测试结果1
*测试结果与运行了100次的附加测试结果一致。
*测试机器为MBP,i7四核。

在有负载的情况下会发生什么呢?

目前为止新API的性能表现非常出色,原因是线程之间对CPU的时间片的竞争非常少。这是理想的环境,但不行的是,理想环境往往不会出现在现实环境中。为了模拟真实的环境,我建立了第二个测试。这次测试使用跟第一次相同的算法,但测试任务在十个并发线程上执行,以模拟处在压力环境中的服务器同时处理十个请求的情况。这十个请求使用传统的顺利处理方法或Java 8的新API处理。

测试结果

  • 排序现在只快了20%
  • 过滤现在只快了20%
  • 分组现在满了15%

更高的规模和竞争水平很可能使这些数字进一步下降。原因是在一个多线程的环境中添加线程并不一定能帮助你提高计算效率,是计算机的CPU个数决定了计算效率,而不是线程个数。

测试结果2

结论

虽然这些都是非常强大和易于使用的API,但它们不是银弹。我们仍然需要花费精力去判断何时应该使用它们。如果你事先知道你会做多个处理并行操作,那么考虑使用排队架构,并使并发操作数和你的处理器数量相匹配可能是一个好主意。这里的难点在于运行时性能将依赖于实际的硬件体系结构和服务器所处的压力情况。你可能只有在压力测试或者生产环境中才能看到代码的运行时性能,使之成为一个“易编码,难调试”的经典案例。

 

参考链接:

http://www.importnew.com/11113.html

图片来源:八恶人(movie)

原文地址:https://www.cnblogs.com/Jacck/p/8095404.html