堆排序

一、定义

1.1 堆

​ 此处的堆,指数据结构中的堆。而不是内存中的那种内存堆,内存堆是基于数据结构的一种实现。堆的数据结构是一棵完全二叉树,它有如下特点:(具体参考下文链接)

  • 堆是一棵完全二叉树
  • 它总是最小值在根节点(或最大值在根节点)
  • 它上一层比下一层小(大)
  • 必定有快速删除根节点,并返回根节点元素的方法
  • 在删除根节点(最小元或者最大元)之后,自动调节使之依然保持堆结构。
  • 插入节点依然保持堆结构

​ 综上,堆结构的基本操作是插入删除根节点,在操作过程中还会保持堆结构不会被破坏。所以我们可以用堆排序,我们可以通过删除根节点得到最小值,再删除根节点,得到第二小值,如此类推,只要一直取根节点,就能得到从小到大的序列。

堆的数据结构:https://www.cnblogs.com/dhcao/p/10591282.html

1.2 堆排序

​ 对一个含有N个元素的数组a,我们利用堆排序的做法:

  • 首先建立一个二叉堆(最小元在根节点)。根据二叉堆的特性,此过程运行时间(O(N))
  • 然后执行(N)次删除最小元(deleteMin)操作,按照顺序,最小的元素先离开堆。
  • 将这些元素记录到第二个数组中,得到一个排序之后的数组(可避免使用第二个数组)。
  • 再将这些数组拷贝回来,得到(N)个元素的排序。

图解

图解描述

​ 我们对数组a进行堆排序,采用根节点存放最大值(最大最小都一样)并且避免使用第二个数组。

  • 构建一个Max堆,最大值在根节点,父节点必定比子节点大。
  • deleteMax,堆缩小1。
  • 将刚刚删除的元素放在空出来的位置。
  • 依次类推,我们借助二叉堆一个重要的特性:删除时,总是空出最后一个元素。这是为了保持它是一个完全二叉树。

以上做法,我们避免使用第二个数组,而是直接在第一个数组中构建一个堆。然后将堆排序!

二、算法分析

​ 堆排序耗费的时间可以分为2个部分。第一阶段构建堆,第二阶段是循环删除根元素(deleteMax)。

​ 第一阶段:从堆的性质我们可以知道,构建N个元素的堆,需要2N次比较。(这是因为堆的性质是父节点大于子节点,所以要选出父节点,需要根左右子节点相互比较)

​ 第二阶段:循环deleteMax。第(i)次deleteMax最多用到(2lfloor logi floor)次比较,这个时间来自于堆的deleteMax时间分析,删除最大值之后,我们需要重新构建堆,那么就需要最后一个位置放入根节点所在的空穴(根节点作为最大值已经被删除,只剩下空穴一个)中,然后采用下沉的方式,将它放到合适的位置,重新构建堆只需要满足父节点大于子节点,所以下沉过程只需要根左子节点和右子节点比较,而二叉树的高是(logN)

​ 所以总时间是:

[第二阶段+第一阶段时间 \ 2(sum_{i=1}^{N}logi )+2N\ =2(log1+log2+···+logN)+2N\ =2(log(1*2*3*···*N))+2N\ =2(logN!)+2N\ =2(log(sqrt{2pi N}frac{N^N}{e^N})+2N\ =2(frac{1}{2}log(2pi)+frac{1}{2}logN + NlogN -Nloge)+2N \ =O(2NlogN-O(N)) ]

关于堆的构建和删除可以参照:https://www.cnblogs.com/dhcao/p/10591282.html

堆排序的时间是:(O(2NlogN-O(N)))

三、代码地址

https://github.com/dhcao/dataStructuresAndAlgorithm/blob/master/src/chapterSeven/HeasportEx.java

原文地址:https://www.cnblogs.com/dhcao/p/10713840.html