“《算法导论》之‘排序’”:堆排序

  关于堆排序的介绍主要引自一博文,比较详细的例子可参考另一博文

  动画演示可以参考一网页

  关于二叉堆,有一博文二叉堆(一)之 图文解析写的很清晰详细,很值得参考。

  堆给人的感觉是一个二叉树,但是其本质是一种数组对象,因为对堆进行操作的时候将堆视为一颗完全二叉树,树中每个节点与数组中的存放该节点值的那个元素对应。所以堆又称为二叉堆,堆与完全二叉树的对应关系如下图所示:

  

  通常给定节点i,可以根据其在数组中的位置求出该节点的父亲节点、左右孩子节点,这三个过程一般采用宏或者内联函数实现。书(《算法导论》)上介绍的时候,数组的下标是从1开始的,所以可得到:PARENT(i)=i/2  LEFT(i) = 2*i   RIGHT(i) = 2*i+1。

  注:个人在程序实现的时候默认是从0开始的,因此left = 2*i+1, right = 2*i+2。

  根据节点数值满足的条件,可以将分为最大堆和最小堆。最大堆的特性是:除了根节点以外的每个节点i,有A[PARENT(i)] >= A[i],最小堆的特性是:除了根节点以外的每个节点i,有A[PARENT(i)] >=A[i]。

  把堆看成一个棵树,有如下的特性:

  1)含有n个元素的堆的高度是lgn。

  2)当用数组表示存储了n个元素的堆时,叶子节点的下标是n/2+1,n/2+2,……,n。

  3)在最大堆中,最大元素该子树的根上;在最小堆中,最小元素在该子树的根上。

保持堆的性质

  堆个关键操作过程是如何保持堆的特有性质,给定一个节点i,要保证以i为根的子树满足堆性质。书中以最大堆作为例子进行讲解,并给出了递归形式的保持最大堆性的操作过程MAX-HEAPIFY(注:我的程序中名为adjustHeap)。先从看一个例子,操作过程如下图所示:  

  

  从图中可以看出,在节点i=2时,不满足最大堆的要求,需要进行调整,选择节点2的左右孩子中最大一个进行交换,然后检查交换后的节点i=4是否满足最大堆的要求,从图看出不满足,接着进行调整,直到没有交换为止。

建堆

  建立最大堆的过程是自底向上地调用最大堆调整程序将一个数组A[1.....N]变成一个最大堆。将数组视为一颗完全二叉树,从其最后一个非叶子节点(n/2)开始调整。调整过程如下图所示:

  

堆排序算法

  堆排序算法过程为:先调用创建堆函数将输入数组A[1...n]造成一个最大堆,使得最大的值存放在数组第一个位置A[1],然后用数组最后一个位置元素与第一个位置进行交换,并将堆的大小减少1,并调用最大堆调整函数从第一个位置调整最大堆。给出堆数组A={4,1,3,16,9,10,14,8,7}进行堆排序简单的过程如下:

  (1)创建最大堆,数组第一个元素最大,执行后结果下图:

  (2)进行循环,从length(A)到1,并不断的调整最大堆,给出一个简单过程如下:

代码实现

 1 void HeapSort::sort()
 2 {
 3     buildHeap();
 4     for (int i = 0; i < len; i++)
 5     {
 6         int hLen = len - i;
 7         // It is been done in buildHeap() when i =  0
 8         if (i != 0)
 9             adjustHeap(0, hLen);
10         exchange(0, hLen - 1);
11     }
12 }
13 
14 void HeapSort::buildHeap()
15 {
16     int n = 1;
17     while (len > pow(2.0, n) - 1)
18     {
19         adjustHeap(0, len);
20         n++;
21     }
22 }
23 
24 void HeapSort::adjustHeap(int start, int hLen)
25 {
26     if (start >= hLen - 1)    return;
27 
28     int left = 2 * start + 1;
29     int right = 2 * start + 2;
30 
31     // This also means left < hLen and
32     // arr[left] and arr[right] exist.
33     if (right < hLen)
34     {
35         // This means arr[start] is smaller than one of its child, so we just
36         // need to find a larger child to replace it.
37         if (arr[start] < arr[left] || arr[start] < arr[right])
38         {
39             if (arr[left] >= arr[right])
40             {
41                 exchange(start, left);
42             }
43             else
44             {
45                 exchange(start, right);
46             }
47         }
48     }
49     // This means left < hLen <= right and arr[right] does not exist.
50     else if (left < hLen)
51     {
52         if (arr[start] < arr[left])
53         {
54             exchange(start, left);
55         }
56     }
57     // This means hLen <= left, arr[left] does not exist and arr[start] has no child.
58     // Actually, 'else' branch is not necessary as 'if (start >= hLen - 1)    return;'
59     // at the beginning has ensured this.
60     else
61     {
62         return;
63     }
64 
65     adjustHeap(start + 1, hLen);
66     adjustHeap(start + 2, hLen);
67 }

  完整程序请见Github.

原文地址:https://www.cnblogs.com/xiehongfeng100/p/4422535.html