数据结构—堆排序

感谢大佬的博客https://www.cnblogs.com/chengxiao/p/6129630.html

预备知识

堆排序

  堆排序是利用这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。

  堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:

同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子

该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:

大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2] 

小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2] 

ok,了解了这些定义。接下来,我们来看看堆排序的基本思想及基本步骤:

堆排序基本思想及步骤

  堆排序的基本思想是:将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

  a.假设给定无序序列结构如下

2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。

4.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。

这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。

此时,我们就将一个无需序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

a.将堆顶元素9和末尾元素4进行交换

b.重新调整结构,使其继续满足堆定义

c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.

后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

 

再简单总结下堆排序的基本思路:

  a.将无需序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;

  b.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;

  c.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。

代码实现

  1 #include <iostream>
  2 using namespace std;
  3 /*
  4  * (最大)堆的向下调整算法
  5  *
  6  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
  7  *     其中,N为数组下标索引值,如数组中第1个数对应的N为0。
  8  *
  9  * 参数说明:
 10  *     a -- 待排序的数组
 11  *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
 12  *     end   -- 截至范围(一般为数组中最后一个元素的索引)
 13  */
 14 void maxHeapDown(int* a, int start, int end)
 15 {
 16     int c = start;            // 当前(current)节点的位置
 17     int l = 2*c + 1;        // 左(left)孩子的位置
 18     int tmp = a[c];            // 当前(current)节点的大小
 19     for (; l <= end; c=l,l=2*l+1)
 20     {
 21         // "l"是左孩子,"l+1"是右孩子
 22         if ( l < end && a[l] < a[l+1])
 23             l++;        // 左右两孩子中选择较大者,即m_heap[l+1]
 24         if (tmp >= a[l])
 25             break;        // 调整结束
 26         else            // 交换值
 27         {
 28             a[c] = a[l];
 29             a[l]= tmp;
 30         }
 31     }
 32 }
 33 
 34 /*
 35  * 堆排序(从小到大)
 36  *
 37  * 参数说明:
 38  *     a -- 待排序的数组
 39  *     n -- 数组的长度
 40  */
 41 void heapSortAsc(int* a, int n)
 42 {
 43     int i,tmp;
 44 
 45     // 从(n/2-1) --> 0逐次遍历。遍历之后,得到的数组实际上是一个(最大)二叉堆。
 46     for (i = n / 2 - 1; i >= 0; i--)
 47         maxHeapDown(a, i, n-1);
 48 
 49     // 从最后一个元素开始对序列进行调整,不断的缩小调整的范围直到第一个元素
 50     for (i = n - 1; i > 0; i--)
 51     {
 52         // 交换a[0]和a[i]。交换后,a[i]是a[0...i]中最大的。
 53         tmp = a[0];
 54         a[0] = a[i];
 55         a[i] = tmp;
 56         // 调整a[0...i-1],使得a[0...i-1]仍然是一个最大堆。
 57         // 即,保证a[i-1]是a[0...i-1]中的最大值。
 58         maxHeapDown(a, 0, i-1);
 59     }
 60 }
 61 
 62 /*
 63  * (最小)堆的向下调整算法
 64  *
 65  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
 66  *     其中,N为数组下标索引值,如数组中第1个数对应的N为0。
 67  *
 68  * 参数说明:
 69  *     a -- 待排序的数组
 70  *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
 71  *     end   -- 截至范围(一般为数组中最后一个元素的索引)
 72  */
 73 void minHeapDown(int* a, int start, int end)
 74 {
 75     int c = start;            // 当前(current)节点的位置
 76     int l = 2*c + 1;        // 左(left)孩子的位置
 77     int tmp = a[c];            // 当前(current)节点的大小
 78     for (; l <= end; c=l,l=2*l+1)
 79     {
 80         // "l"是左孩子,"l+1"是右孩子
 81         if ( l < end && a[l] > a[l+1])
 82             l++;        // 左右两孩子中选择较小者
 83         if (tmp <= a[l])
 84             break;        // 调整结束
 85         else            // 交换值
 86         {
 87             a[c] = a[l];
 88             a[l]= tmp;
 89         }
 90     }
 91 }
 92 
 93 /*
 94  * 堆排序(从大到小)
 95  *
 96  * 参数说明:
 97  *     a -- 待排序的数组
 98  *     n -- 数组的长度
 99  */
100 void heapSortDesc(int* a, int n)
101 {
102     int i,tmp;
103     // 从(n/2-1) --> 0逐次遍历每。遍历之后,得到的数组实际上是一个最小堆。
104     for (i = n / 2 - 1; i >= 0; i--)
105         minHeapDown(a, i, n-1);
106     // 从最后一个元素开始对序列进行调整,不断的缩小调整的范围直到第一个元素
107     for (i = n - 1; i > 0; i--)
108     {
109         // 交换a[0]和a[i]。交换后,a[i]是a[0...i]中最小的。
110         tmp = a[0];
111         a[0] = a[i];
112         a[i] = tmp;
113         // 调整a[0...i-1],使得a[0...i-1]仍然是一个最小堆。
114         // 即,保证a[i-1]是a[0...i-1]中的最小值。
115         minHeapDown(a, 0, i-1);
116     }
117 }
118 
119 int main()
120 {
121     int i;
122     int a[] = {20,30,90,40,70,110,60,10,100,50,80};
123     int ilen = (sizeof(a)) / (sizeof(a[0]));
124     cout << "before sort:";
125     for (i=0; i<ilen; i++)
126         cout << a[i] << " ";
127     cout << endl;
128     heapSortAsc(a, ilen);            // 升序排列
129     //heapSortDesc(a, ilen);        // 降序排列
130     cout << "after  sort:";
131     for (i=0; i<ilen; i++)
132         cout << a[i] << " ";
133     cout << endl;
134     return 0;
135 }
原文地址:https://www.cnblogs.com/wkfvawl/p/9798561.html