[知识点] 7.4 堆与优先队列

总目录 > 7 数据结构 > 7.4 堆与优先队列

前言

小时候，学长对我讲，堆和优先队列，是一个意思。一开始学了堆，然后一直手写堆；自从有一天被告知 STL 中的 priority_queue 就是堆之后，也就再也没写过堆了。

这里好好理清楚两者的概念，并回顾一下堆，再拓展一下更多的内容。

子目录列表

1、堆与二叉堆

2、二叉堆的存储与操作

3、堆排序

4、特殊的堆

5、优先队列

7.4 堆与优先队列

1、堆与二叉堆

堆是一种特殊的树，其每个结点的权值必须大于等于或小于等于其父亲结点的权值。也就是说，堆本身并不是一种数据结构，而是对树上结点权值有特定要求的一种树。

堆的种类很多，以二叉堆最为常见。通常我们提及的堆是狭义的二叉堆，所以不少地方会直截了当地定义为 “堆是一棵二叉树”，其实不够严谨。除了二叉堆，广义的堆还包括配对堆，左偏树，二项堆，斐波那契堆等，它们并不全是二叉堆。

堆与二叉堆的关系同树与二叉树一样 —— 二叉堆是所有结点至多只有 2 个儿子结点的堆，是一棵具有堆性质的二叉树。同时，它还有一个性质 —— 所有叶子结点都处于深度最大或次大的层次，即完全二叉树。

根据父子结点大小关系，二叉堆可以分成两类：

> 大根堆：结点权值小于等于父亲结点权值

> 小根堆：结点权值大于等于父亲结点权值

比如下面两棵树，分别为大根堆和小根堆。

2、二叉堆的存储与操作

下面的内容均以大根堆为例。

① 存储

在二叉树部分（7.3 树与二叉树）已经介绍了二叉树的顺序与链式存储结构，堆属于完全二叉树，所以使用顺序存储更方便。下面的二叉堆操作代码均为顺序存储。

② 插入

> 概念

向二叉堆插入一个元素，插入后依旧保持堆性质。

> 思路

在最下一层最右侧叶子结点后插入，如果已经是满二叉树，则新增一层。此时，树仅满足完全二叉树性质，而不满足堆性质，则需要向上调整。

从插入的结点开始，如果该结点权值大于父亲结点，则两个结点交换，重复该过程，直到满足堆性质。向上调整过程时间复杂度为 O(log n)。

> 代码

void insert(int x) {
    tot++;
    int o = x;
    while (a[o] > a[fa] && o != 1)
        swap(a[o], a[fa]), o = fa;
}

③ 删除

> 概念

删除堆中最大的元素，即根结点，删除后依旧保持堆性质。

> 思路

如果直接删除，则变成了两个堆，不满足堆性质，则需要向下调整。

我们将当前根结点与最后一个结点交换，并删除最后结点（即原根结点），当前该根结点不一定满足堆性质，则从该结点开始，找到其子结点中最大的，两个结点交换，重复该过程，直到子结点均小于该结点，或到达最下一层。向下调整过程时间复杂度为 O(log n)。

> 代码

void del() {
    int o = 1;
    a[1] = a[tot], a[tot] = 0, tot--;
    while (ls <= tot) {
        if (a[o] > max(a[ls], a[rs])) break;
        if (a[ls] > a[rs])
            swap(a[o], a[ls]), o = ls;
        else
            swap(a[o], a[rs]), o = rs;
    }
}

④ 构造

> 概念

给出一个数列，将数列各个数放入堆中。

> 思路

将数列的数逐一插入即完成构造，即向上调整法；同样也可以选择向下调整法。

> 代码

略。

3、堆排序

以大根堆为例，将有 n 个元素的数列构造为堆，每次取出的根结点为当前最大值，取出 n 次，即完成从大到小的排序。时间复杂度为 O(n log n)。

代码：

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 #define MAXN 100005
 5 #define ls o << 1
 6 #define rs o << 1 | 1
 7 #define fa o >> 1
 8 
 9 int n;
10 
11 class Heap {
12 public:
13     void insert(int x) {
14         tot++;
15         int o = x;
16         while (a[o] > a[fa] && o != 1)
17             swap(a[o], a[fa]), o = fa;
18     }
19     int top() {
20         return a[1];
21     } 
22     void del() {
23         int o = 1;
24         a[1] = a[tot], a[tot] = 0, tot--;
25         while (ls <= tot) {
26             if (a[o] > max(a[ls], a[rs])) break;
27             if (a[ls] > a[rs])
28                 swap(a[o], a[ls]), o = ls;
29             else
30                 swap(a[o], a[rs]), o = rs;
31         }
32     }
33     void outp() {
34         for (int i = 1; i <= tot; i++)
35             cout << a[i] << ' ';
36         cout << endl;
37     }
38     int a[MAXN];
39     static int tot;
40 } h;
41 
42 int Heap :: tot;
43 
44 int main() {
45     cin >> n;
46     for (int i = 1; i <= n; i++)
47         cin >> h.a[i], h.insert(i);
48     while (h.tot)
49         cout << h.top() << ' ', h.del();
50     return 0;
51 }

4、特殊的堆

除了二叉堆，堆家族里还有配对堆，左偏树，二项堆，斐波那契堆等等。

暂时放个原网站的图。

5、优先队列

小明楼下有两家包子店，一家平价包子店，大家先排队的先买到包子，这样的队即普通的队列；一家贵族包子店，对于一列排队的人，店小二每次从中选出位置最高的辣个人让他先买包子，正所谓贵族优先，这样的队列我们称之为优先队列。

优先队列是一种特殊的队列，但并不满足普通队列的 FIFO 原则，而是根据设定的优先级来出队。最简单的，如果队列中存储的是 int 类型变量，优先级可以为较小值，即每次出队值最小的元素，反之同理，也可以为较大值。

我们发现，队列用数组实现是很轻松的，只需要两个 head, tail 两个指针就能表示入队出队操作；而对于优先队列，我们需要动态维护当前队列内优先级最高的元素，使用简单的数组显然是复杂度爆炸的，这时候，我们抬头看看上面介绍的堆，一切都变得明朗起来。

堆的特性注定了它的不凡 —— 对于大根堆，其根结点必然是整棵树的最大权值，正好满足我们优先队列在优先级设定为最大值时的需求，且动态维护这个最大值效率很高。小根堆同理。所以，优先队列的出队操作，和堆的取出根结点元素操作是等价的，这就是为什么之前会认为堆和优先队列是一个东西，因为相关性实在太强，但是，它们的正确关系应该为：

优先队列这个数据结构是通过堆来实现的。

C++ 的 STL 中有对优先队列的直接实现，即 priority_queue，它的构造方式为：

priority_queue <Typename T, Container, Functional> q;

STL 优先队列是使用二叉堆的最大堆实现的。当然，可以通过重载运算符将其更改为最小堆，以及支持对非常规变量的比较。无独有偶，Java 中也内置了 java.util.PriorityQueue，不同的是它内置的是最小堆，同样可以通过比较器来更改为最大堆。