堆排序概述及代码实现

一、堆排序概述

当你看到这里请去原作者那里点个赞, 原文链接

1.堆是一种数据结构 

可以将堆看作一棵完全二叉树,这棵二叉树满足,任何一个非叶节点的值都不大于(或不小于)其左右孩子节点的值。 
这里写图片描述

2. 堆的存储 

一般用数组来表示堆,若根节点存在于序号0处,i结点的父结点下表就为(i-1)/2,i结点的左右子结点下标分别为2i+1和2i+2

3. 堆排序思想 

利用大顶堆(小顶堆)堆顶记录的是最大关键字(最小关键字)这一特性,使得每次从无序中选择最大记录(最小记录)变得简单。

4. 堆排序的实现 

堆排序需要解决两个问题:

  • 如何由一个无序序列建成一个堆
  • 如何在输出堆顶元素之后,调整剩余元素成为一个新的堆?

针对第二个问题:一般在输出堆顶元素之后,视为将这个元素排除,然后用表中最后一个元素填补它的位置,自上向下进行调整:首先将堆顶元素和它的左右子树的根结点进行比较,把最小的元素交换到堆顶;然后顺着被破坏的路径一路调整下去,直至叶子结点,就得到新的堆。

Step 1: 构造初始堆

初始化堆时是对所有的非叶子结点进行筛选 
最后一个非终端元素的下标是[n/2]向下取整,所以筛选只需要从第[n/2]向下取整个元素开始,从后往前进行调整。

Step 2:进行堆排序

堆排序是一种选择排序。建立的初始堆为初始的无序区。

排序开始,首先输出堆顶元素(因为它是最值),将堆顶元素和最后一个元素交换,这样,第n个位置(即最后一个位置)作为有序区,前n-1个位置仍是无序区,对无序区进行调整,得到堆之后,再交换堆顶和最后一个元素,这样有序区长度变为2。。。

不断进行此操作,将剩下的元素重新调整为堆,然后输出堆顶元素到有序区。每次交换都导致无序区-1,有序区+1。不断重复此过程直到有序区长度增长为n-1,排序完成。

5. 堆排序实例 

1)首先,建立初始的堆结构图 
这里写图片描述 
2)然后,交换堆顶的元素和最后一个元素,此时最后一个位置作为有序区(有序区显示为黄色),然后进行其他无序区的堆调整,重新得到大顶堆后,交换堆顶和倒数第二个元素的位置…… 
这里写图片描述 
3)重复此过程 
这里写图片描述 
4)最后,有序区扩展完成即排序完成 
这里写图片描述

由排序过程可见,若想得到升序,则建立大顶堆,若想得到降序,则建立小顶堆。

6. 堆排序分析 

稳定性: 
时间复杂度:O(nlogn) 
空间复杂度:

堆排序方法对记录数较少的文件并不值得提倡,但对n较大的文件还是很有效的。因为其运行时间主要耗费在建初始堆和调整建新堆时进行的反复“筛选”上。

二: Python代码

简洁版:

def sift_down(arr, start, end):
    root = start
    while True:
        # 从root开始对最大堆调整
        child = 2 * root + 1
        if child > end:
            break

        # 找出两个child中交大的一个
        if child + 1 <= end and arr[child] < arr[child + 1]:
            child += 1

        if arr[root] < arr[child]:
            # 最大堆小于较大的child, 交换顺序
            arr[root], arr[child] = arr[child], arr[root]

            # 正在调整的节点设置为root
            root = child
        else:
            # 无需调整的时候, 退出
            break


def heap_sort(arr):
    # 从最后一个有子节点的孩子来调整最大堆
    first = len(arr) // 2 - 1
    for start in range(first, -1, -1):
        sift_down(arr, start, len(arr) - 1)

    # 将最大的放到堆的最后一个, 堆-1, 继续调整排序
    for end in range(len(arr) -1, 0, -1):
        arr[0], arr[end] = arr[end], arr[0]
        sift_down(arr, 0, end - 1)
View Code

注释版:

def sift_down(arr, start, end):
    root = start
    while True:
        # 从root开始对最大堆调整
        child = 2 * root + 1
        # child为root的左孩子
        if child > end:
            # 超出序列的范围
            break

        # 找出两个child中较大的一个
        if child + 1 <= end and arr[child] < arr[child + 1]:
            # 如果右孩子存在, 而且左孩子小于右孩子
            child += 1
            # 将child指向右孩子

        if arr[root] < arr[child]:
            # 如果root 小于 它的较大child
            arr[root], arr[child] = arr[child], arr[root]
            # root 与 child, 交换位置

            root = child
            # 正在调整的节点设置为root
        else:
            # 无需调整的时候, 退出
            break


def heap_sort(arr):

    # 从最后一个有子节点的节点 来 调整最大堆
    first = len(arr) // 2 - 1
    # first: 最后一个有子节点的节点的下标
    for start in range(first, -1, -1):
        sift_down(arr, start, len(arr) - 1)

    # 将堆内的首节点存储到有序区
    for end in range(len(arr) -1, 0, -1):

        arr[0], arr[end] = arr[end], arr[0]
        sift_down(arr, 0, end - 1)

        """
            有序区: 从尾节点的位置, 根据循环的次数, 依次向前移动, 直到堆为空, 即: 有序区的长度为堆的原始长度
            
            1. for end in range(len(arr)-1, 0, -1)
                len(arr)-1: arr内的最后一个节点的下标
                end: 从arr的最后一个节点开始遍历, 即: 将arr倒序遍历
            
            2. arr[0], arr[end] = arr[end], arr[0]
                
                将arr内的首节点, 存储到有序区
                1. 
                    arr[0]: 
                    root节点, 堆顶, arr内的第一个元素,
                    如果arr是大顶堆, 则是arr内的最大元素,
                    如果arr是小顶堆, 则是arr内的最小元素
                
                2. 
                    arr[end]:
                    arr内的尾节点, 有序区的首节点 
                    根据循环的次数, 位置依次向前移动
            
        """



if __name__ == "__main__":
    l = list(i for i in range(0, 1000))
    print("洗牌之前的列表:" + str(l))
    random.shuffle(l)
    print("洗牌之后的列表:" + str(l))
    heap_sort(l)
    print(l)
View Code
原文地址:https://www.cnblogs.com/amou/p/9057050.html