排序算法比较

比较排序和非比较排序

常见的排序算法都是比较排序，非比较排序包括计数排序、桶排序和基数排序，非比较排序对数据有要求，因为数据本身包含了定位特征，所有才能不通过比较来确定元素的位置。

比较排序的时间复杂度通常为O(n2)或者O(nlogn)，比较排序的时间复杂度下界就是O(nlogn)，而非比较排序的时间复杂度可以达到O(n)，但是都需要额外的空间开销。

比较排序时间复杂度为O(nlogn)的证明：

a1,a2,a3……an序列的所有排序有n!种，所以满足要求的排序a1',a2',a3'……an'（其中a1'<=a2'<=a3'……<=an'）的概率为1/n!。基于输入元素的比较排序，每一次比较的返回不是0就是1，这恰好可以作为决策树的一个决策将一个事件分成两个分支。比如冒泡排序时通过比较a1和a2两个数的大小可以把序列分成a1,a2……an与a2,a1……an（气泡a2上升一个身位）两种不同的结果，因此比较排序也可以构造决策树。根节点代表原始序列a1,a2,a3……an，所有叶子节点都是这个序列的重排（共有n!个，其中有一个就是我们排序的结果a1',a2',a3'……an'）。如果每次比较的结果都是等概率的话（恰好划分为概率空间相等的两个事件），那么二叉树就是高度平衡的，深度至少是log(n!)。

又因为

n! < nn ,两边取对数就得到log(n!)<nlog(n)，所以log(n!) = O(nlogn).
n!=n(n-1)(n-2)(n-3)…1 > (n/2)^(n/2) 两边取对数得到 log(n!) > (n/2)log(n/2) = Ω(nlogn)，所以 log(n!) = Ω(nlogn)。

因此log(n!)的增长速度与 nlogn 相同,即 log(n!)=Θ(nlogn)，这就是通用排序算法的最低时间复杂度O(nlogn)的依据。

稳定排序和非稳定排序

简单地说就是所有相等的数经过某种排序方法后，仍能保持它们在排序之前的相对次序，我们就
说这种排序方法是稳定的。反之，就是非稳定的。
比如：一组数排序前是a1,a2,a3,a4,a5，其中a2=a4，经过某种排序后为a1,a2,a4,a3,a5，
则我们说这种排序是稳定的，因为a2排序前在a4的前面，排序后它还是在a4的前面。假如变成a1,a4,
a2,a3,a5就不是稳定的了。

内排序和外排序

在排序过程中，所有需要排序的数都在内存，并在内存中调整它们的存储顺序，称为内排序；
在排序过程中，只有部分数被调入内存，并借助内存调整数在外存中的存放顺序排序方法称为外排序。

	平均情况	最好情况	最坏情况
归并排序	O(nlogn)	O(nlogn)	O(nlogn)
基数排序	O(n)	O(n)	O(n)
快速排序	O(nlogn)	O(nlogn)	O(n2)
希尔排序	O(n1.5)	O(n)	O(n1.5)
插入排序	O(n2)	O(n)	O(n2)
选择排序	O(n2)	O(n2)	O(n2)

排序的稳定性和复杂度

不稳定：

选择排序（selection sort）— O(n2)
快速排序（quicksort）— O(nlogn) 平均时间, O(n2) 最坏情况; 对于大的、乱序串列一般认为是最快的已知排序
堆排序（heapsort）— O(nlogn
希尔排序（shell sort）— O(nlogn)
基数排序（radix sort）— O(n·k); 需要 O(n) 额外存储空间（K为特征个数）

稳定：

插入排序（insertion sort）— O(n2)
冒泡排序（bubble sort） — O(n2)
归并排序（merge sort）— O(n log n); 需要 O(n) 额外存储空间
二叉树排序（Binary tree sort） — O(nlogn); 需要 O(n) 额外存储空间
计数排序 (counting sort) — O(n+k); 需要 O(n+k) 额外存储空间，k为序列中Max-Min+1
桶排序（bucket sort）— O(n); 需要 O(k) 额外存储空间

代码参考

#_*_coding:utf-8_*_

import random
#选择排序递归实现
def sel_sort_rec(list,n):
    if n == 0:
        return
    max_j = n
    for j in range(n):
        if list[j] > list[max_j]:
            max_j = j
    list[n], list[max_j] = list[max_j], list[n]
    sel_sort_rec(list,n-1)

#选择排序循环实现
def sel_sort(list):
    for i in range(len(list)):
        min_j = i
        for j in range(i+1,len(list)):
            if list[min_j] > list[j]:
                min_j = j
        list[min_j], list[j] = list[min_j], list[j]

#插入排序递归实现
def ins_sort_rec(list,n):
    if n == 0:
        return
    ins_sort_rec(list,n-1)
    j = n
    while j > 0 and list[j-1] >list[j]:
        list[j-1], list[j] = list[j], list[j-1]
        j -= 1


#插入排序循环实现
def ins_sort(list):
    for i in range(1,len(list)):
        j = i
        while j > 0 and list[j-1] > list[j]:
            list[j-1], list[j] = list[j], list[j-1]
            j -= 1

#递归的合并排序实现
def merge_sort(A):
    if len(A) <= 1:
        return A
    middle = len(A) // 2
    leftA = A[:middle]
    rightA = A[middle:]
    leftA_sorted = merge_sort(leftA)
    rightA_sorted = merge_sort(rightA)
    return merge(leftA_sorted,rightA_sorted)

#合并两个已经排序的序列
def merge(left, right):
    i, j = 0, 0
    alist = []
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            alist.append(left[i])
            i += 1
        else:
            alist.append(right[j])
            j += 1
    while i < len(left):   #左边剩余数据处理
        alist.append(left[i])
        i += 1
    while j < len(right):  #右边剩余数据处理
        alist.append(right[j])
        j += 1
    return alist




def main():
    list = [random.randint(1,10) for x in range(10)]
    sel_sort_rec(list,9)
    print("选择排序递归实现："+str(list))
    sel_sort(list)
    print("选择排序循环实现："+str(list))
    merge_sort(list)
    print("合并排序实现结果："+str(list))


if __name__ == '__main__':
    main()

参考链接