《编程珠玑》阅读小记(11) — 堆

章节简述

本章主要介绍堆,用该数据结构解决下面两个重要的问题:

  • 排序,采用堆排序算法对n元数组排序,所花的时间不会超过O(nlogn),而且只需要几个字的额外空间;
  • 优先级队列,堆通过插入新元素和提取最小元素这两种操作来维护元素集合,每个操作所需的时间都为O(logn);

本章采用自底向上的组织结构,从细节开始逐步过渡到正题。

堆数据结构

该部分介绍堆数据结构的设计思想。

优先级队列实现向量排序算法

优先级队列提供了一种简单的向量排序算法,优先在优先级队列中依次插入每个元素,然后按序删除它们,程序实现代码如下:

/************************************************************************/
/* 
 * 优先级队列的类实现
 */
/************************************************************************/

#ifndef _PRIQUEUE_H_
#define _PRIQUEUE_H_

#include <iostream>

template<typename T>
class PriQueue{
private:
    int n, maxsize;
    T *x;

    void swap(int i, int j)
    {
        T temp = x[i];
        x[i] = x[j];
        x[j] = temp;
    }

public:
    PriQueue(int m) :maxsize(m)
    {
        x = new T[maxsize + 1];
        n = 0;
    }

    void insert(T t)
    {
        int i, p;
        x[++n] = t;

        //自底向上类似siftup函数内容实现优先级序列
        for (i = n ; i > 1 && x[p=i/2] > x[i] ;  i = p)
            swap(p, i);
    }

    //输出队列顶并调整队列结构
    T extramin()
    {

        /*cout << "队列中的数据为:" << endl;
        for (int i = 1; i <= n; i++)
        cout << x[i] << "	";
        cout << endl;*/

        int i, c;
        T t = x[1];
        x[1] = x[n--];

        //自顶向下调整队列结构
        for (i = 1; (c = 2 * i) <= n; i = c)
        {
            if (c + 1 <= n && x[c + 1] < x[c])
                c++;

            if (x[i] <= x[c])
                break;

            swap(c, i);
        }


        return t;
    }
};
#endif

main主程序实现如下:

/************************************************************************/
/* 《编程珠玑》第十四章 堆
* 问题:程序的输入包含两个整数m和n,其中m<n。输出是0~n-1范围内m个随机整数的有序列表,不允许重复
* 方案:使用堆数据结构思想,构造优先级队列,设计出一种向量排序算法
*/
/************************************************************************/

#include <iostream>
#include <algorithm>
#include <cstdlib>
#include "PriQueue.h"
using namespace std;


/************************************************************************/
/* 解决问题的向量排序算法                                                 */
/************************************************************************/
template<typename T>
void pqsort(T *v , int n)
{
    PriQueue<T> pq(n);
    for (int i = 0; i < n; i++)
    {
        pq.insert(v[i]);
    }

    for (int j = 0; j < n; j++)
    {
        v[j] = pq.extramin();
    }
}

const int N = 10;
int main()
{
    int arr[N] = { 4, 12 , 56 , 32 , 24 , 68 , 33 , 6 , 7 , 2 };
    cout << "排序前输入数据为 :"<<endl;
    for (int j = 0; j < N; j++)
    {
        cout << arr[j] << "	";
    }
    cout << endl;

    pqsort(arr,N);

    cout << "排序后输出数据为 : " << endl;
    for (int j = 0; j < N; j++)
    {
        cout << arr[j] << "	";
    }
    cout << endl;

    system("pause");
    return 0;
}

对于上面实现的优先级队列向量排序算法,n次insert和extractmin操作在最坏情况下的开销是O(nlogn),优于快速排序算法的最坏O(n^2)的复杂度,但是缺点是,该算法需要额外的n+1的字节的空间来存储数组x[0…n];

下面讨论的堆排序,改进了基于优先级队列的向量排序算法,代码更加简洁,而且不需要辅助数组,使用的空间更少。

堆排序算法

对于优先级队列实现的向量排序算法,需要两个数组,一个用于优先级队列,一个用于待排序的元素;而堆排序算法只需要一个数组,因此节省了空间开销。
思想:使用单个数组x同时表示两种抽象结构,左边是堆,右边是输入元素序列。元素的初始顺序是随意的,而最终则是有序的。
算法实现:

这里写代码片

原理

本章最终总结以下几个原理:

  • 高效性,堆数据结构形状保证了堆中所有节点和根节点之间相差的层数在logn内,由于树是平衡的,所以函数siftup和siftdown的运行效率很高。堆排序通过在同一个实现数组中包含两种抽象结构(堆和元素序列)来避免使用额外的开销;
  • 正确性;
  • 抽象性,一个好的工程师能够分清某个组件做什么(用户看到的抽象功能)和如何做(黑盒实现)之间的差别;
  • 过程抽象;
  • 抽象数据类型:数据类型做什么是由它的方法和方法的规范给出的,而如何做则是由具体实现决定的;
原文地址:https://www.cnblogs.com/shine-yr/p/5214942.html