并行排序

排序是一项非常常用的操作,你的应用程序在运行时,可能无时无刻不在进行排序操作。排序的算法有很多,但是对于大部分的算法都是串行执行的。当排序的元素很多时,若使用并行算法代替串行,显然可以更加有效的利用CPU,提高排序效率。但将串行算法修改为并行算法并非易事,甚至会极大的增加原有算法的复杂度。下面介绍几种相对简单的算法。

奇偶交换排序:分离数据相关性

  在介绍奇偶交换排序前,首先来看一下冒泡排序。在这里,我们将数组从小到大排序:

 1 public static int[] bubbleSort(int[] arr){
 2         for (int i = 0;i < arr.length - 1;i++){
 3             for (int j = 0;j < arr.length - 1 - i;j++){
 4                 if (j+1 == arr.length-i){
 5                     break;
 6                 }
 7                 if (arr[j] > arr[j+1]){
 8                     int temp = arr[j];
 9                     arr[j] = arr[j+1];
10                     arr[j+1] = temp;
11                 }
12             }
13         }
14         return arr;
15     }

  在冒泡排序的交换过程中,由于每次交换的两个元素存在数据冲突,也就是对于每个元素,它既可能与前面的元素交换,也可能与后面的元素交换,因此很难直接改造成并行算法。如果能够解开这种数据的相关性,就可以比较容易的使用并行算法来实现类似的排序。奇偶交换排序就是基于这种思想的对于奇偶交换来说,它将排序过程分为两个阶段,奇交换和偶交换。对于奇交换来说,它总是比较奇数索引以及相邻的后续元素;偶交换总是比较偶数索引和其相邻的后续元素,并且奇交换和偶交换会成对出现,这样才能保证比较和交换涉及到数组中的每一个元素。

 从上图可以看出,由于将整个比较交换独立分割为奇阶段和偶阶段。这就使得在每一个阶段内,所有的比较和交换都是没有数据相关性的。因此,每一次比较和交换都可以独立执行,也就可以并行化了。

下面是奇偶交换的串行实现:

 1 public static int[] oddEvevSort(int[] arr){
 2         int exchFlag = 1,start = 0;
 3         while (exchFlag == 1 || start == 1){
 4             exchFlag = 0;
 5             for (int i = start;i < arr.length - 1;i += 2){
 6                 if (arr[i] > arr[i+1]){
 7                     int temp = arr[i];
 8                     arr[i] = arr[i+1];
 9                     arr[i+1] = temp;
10                     exchFlag = 1;
11                 }
12             }
13             if (start == 0){
14                 start = 1;
15             }else {
16                 start = 0;
17             }
18         }
19         return arr;
20     }

上述代码中,exchFlag用来记录当前迭代是否发生了数据交换,而start变量用来表示是奇交换还是偶交换。初始时,start为0,表示进行偶交换,每次迭代结束后,切换start状态。如果上一次发生了数据交换,或者当前进行的是奇交换,循环就不会停止,直到程序不再发生交换,并且当前进行的是偶交换为止(表示奇偶交换已经成对出现)。

下面是奇偶交换的并行排序:

 1 public class CurrentOddEven {
 2     static int[] arr = {23,3,23,4,5,5,6,6,6453,678,68,9,9,79878,97,897897,98,78};
 3     static int exchFlag = 1;
 4     static synchronized void setExchFlag(int v){
 5         exchFlag = v;
 6     }
 7 
 8     static synchronized int getExchFlag(){
 9         return exchFlag;
10     }
11     public static class OddEvenSortTask implements Runnable{
12         int i;
13         CountDownLatch latch;
14 
15         public OddEvenSortTask(int i,CountDownLatch latch){
16             this.i = i;
17             this.latch = latch;
18         }
19 
20         @Override
21         public void run() {
22             if (arr[i] > arr[i+1]){
23                 int temp = arr[i];
24                 arr[i] = arr[i+1];
25                 arr[i+1] = temp;
26                 setExchFlag(1);
27             }
28             latch.countDown();
29         }
30     }
31 
32     public static void main(String[] args) throws InterruptedException {
33         int start = 0;
34         ExecutorService es = Executors.newCachedThreadPool();
35         while (getExchFlag() == 1 || start == 1){
36             setExchFlag(0);
37             //偶数的数组长度,当start=1时,只有length/2-1 个线程
38             CountDownLatch latch = new CountDownLatch(arr.length/2-(arr.length%2 == 0?start:0));
39             for (int i = start;i < arr.length - 1;i += 2){
40                 es.submit(new OddEvenSortTask(i,latch));
41             }
42             //等待所有线程结束
43             latch.await();
44             if (start == 0){
45                 start = 1;
46             }else {
47                 start = 0;
48             }
49         }
50         for (int temp:arr){
51             System.out.println(temp);
52         }
53         es.shutdown();
54     }
55 }

 上述代码第11行,定义了奇偶排序的任务类。该任务的主要工作是进行数据的比较和交换(第22~26行)。并行排序的主体在main方法中,使用了countDownLatch来记录线程数量,对于每一次的迭代,使用单独的线程对每一次元素比较和交换操作,在下一次的迭代开始之前,必须等上一次的迭代必须完成。

 希尔排序:改进的插入排序

插入排序也是一种很常见的排序算法。它的基本思想:一个未排序的数组(当然也可以是链表)可以分为两个部分,前半部分是已经排序的,后半部分是未排序的。在进行排序时,只需要在未排序的部分中选择一个元素,将其插入前面有序的数组中即可。最终,未排序的部分会越来越少,直到为0,那么排序就完成了。初始时,可以假设已排序部分就是第一个元素。

插入排序串行排序如下:

 1 public static int[] insertSort(int[] arr){
 2         int length = arr.length;
 3         int i,j,key;
 4         for (i = 1;i < length;i++){
 5             //key为要准备插入的元素
 6             key = arr[i];
 7             j = i - 1;
 8             while (j >= 0 && arr[j] > key){
 9                 arr[j+1] = arr[j];
10                 j--;
11             }
12             //找到合适的位置插入key
13             arr[j+1] = key;
14         }
15         return arr;
16     }

上述代码第6行,提取准备插入的元素(也就是未排序序列中的第一个元素)。接着,在已排序的序列中找到这个元素的插入位置(第8~10行),并进行插入(第13行)即可。

简单的插入排序是很难进行并行化的。因为这一次的数据插入依赖于上一次得到的有序序列,因此多个步骤之间无法并行。为此,我们可以对插入排序进行扩展,就是希尔排序。

希尔排序将整个数组根据间隔h分割为若干个数组。子数组相互穿插在一起,每一次排序时,分别对每一个子数组进行排序。如下图所示(借大神的图侵删):

从上图可以看出,每一组排序完成后,可以递减h的值,进行下轮更精细的排序,知道h=1,此时,等价于一次插入排序。

希尔排序的一个主要优点是,即使最小的一个元素在数组的末尾,由于每次元素的移动都以h为间隔进行,因此数组末尾的小元素可以在很少的交换次数下,就被置换到最接近元素最终位置的地方。

下面是希尔排序的串行实现:

 1 public static int[] shellSort(int[] arr){
 2         //计算出最大的h值
 3         int h = 1;
 4         while (h <= arr.length/3){
 5             h = h*3 + 1;
 6         }
 7         while (h > 0){
 8             for (int i = h;i < arr.length;i++){
 9                 if (arr[i] < arr[i - h]){
10                     int temp = arr[i];
11                     int j = i - h;
12                     while (j >= 0 && arr[j] > temp){
13                         arr[j + h] = arr[j];
14                         j -= h;
15                     }
16                     arr[j + h] = temp;
17                 }
18             }
19             //计算出下一个h值
20             h = (h - 1)/3;
21         }
22         return arr;
23     }

上述代码的4~6行,计算出一个合适的h值,接着进行正式的希尔排序。第8行代码的for循环进行间隔为h的插入排序,每次排序结束后,递减h的值(第20行),直到h=1,退化为插入排序。

由于希尔排序每次都针对不同的子数组进行排序,各个子数组之间是完全独立的,因此,是可以改写为并行程序的:

 1 public class CurrentShellSort {
 2     static int[] a = {2,3,1,45,53,3,55,4,65,765,7,7,89687,6,89,69,4354,89,99};
 3     static ExecutorService pool = Executors.newCachedThreadPool();
 4 
 5     public static class ShellSortTask implements Runnable {
 6 
 7         int x = 0;
 8         int h = 0;
 9         CountDownLatch l;
10 
11         public ShellSortTask(int x, int h, CountDownLatch latch) {
12             this.x = x;
13             this.h = h;
14             this.l = latch;
15         }
16 
17         public void run() {
18             int i, j, key;
19             for (i = x + h; i < a.length; i = i + h) {
20                 if (a[i] < a[i - h]) {
21                     j = i - h;
22                     key = a[i];
23                     while (j >= 0 && a[j] > key) {
24                         a[j + h] = a[j];
25                         j -= h;
26                     }
27                     a[j + h] = key;
28                 }
29             }
30             l.countDown();
31         }
32     }
33 
34     public static void pShellSort(int[] arr) throws InterruptedException {
35         // 计算出最大的n值
36         int h = 1;
37         CountDownLatch lathc = null;
38         while (h <= arr.length / 3) {
39             h = h * 3 + 1;
40         }
41         while (h > 0) {
42             System.out.println("h=" + h);
43             lathc = new CountDownLatch(h);
44             for (int x = 0; x < h; x++) {
45                 pool.submit(new ShellSortTask(x, h, lathc));
46             }
47             lathc.await();
48             System.out.println(Arrays.toString(arr));
49             // 计算下一个h值
50             h = (h - 1) / 3;
51         }
52         pool.shutdown();
53     }
54     //测试
55     public static void main(String[] args) throws InterruptedException {
56         pShellSort(a);
57     }
58 }

 输出结果:

h=13
[2, 3, 1, 45, 53, 3, 55, 4, 65, 765, 7, 7, 89687, 6, 89, 69, 4354, 89, 99]
h=4
[2, 3, 1, 4, 53, 3, 7, 7, 65, 6, 55, 45, 4354, 89, 89, 69, 89687, 765, 99]
h=1
[1, 2, 3, 3, 4, 6, 7, 7, 45, 53, 55, 65, 69, 89, 89, 99, 765, 4354, 89687]

参考:《Java高并发程序设计》 葛一鸣 郭超 编著:

作者:Joe
努力了的才叫梦想,不努力的就是空想,努力并且坚持下去,毕竟这是我相信的力量
原文地址:https://www.cnblogs.com/Joe-Go/p/9828848.html