普林斯顿大学算法课 Algorithm Part I Week 3 排序算法复杂度 Sorting Complexity

计算复杂度(Computational complexity):用于研究解决特定问题X的算法效率的框架

计算模型(Model of computation):可允许的操作(Allowable operations)

成本模型(Cost model):操作数(Operation counts)

复杂度上界(Upper bound):保证能在一定的时间内解决

复杂度下界(Lower bound):通过数学方法证明,必须花费的最少时间

最优算法(Optimal algorithm):可能达到的最小复杂度的算法(Algorithm with best possible cost guarantee for X),通常介于复杂度上界和下界之间

举例:排序

决策树模型:

有三个不同的元素a b c,通过比较的方式来得出排序结果。那么它的决策树为下图所示

树的高度代表了最差情况下需要比较的次数。
树的宽度代表了可能的排列顺序。

命题

任何基于比较的排序算法在最坏情况下至少要lg(N!) ~ N lgN 次比较。

证明

  1. 假设数组由N个不同的值组成,从a1到an
  2. 最坏情况由决策树的高度决定
  3. 二叉树最多可能的叶子节点数是2^h
  4. 因为数组有N!中不同的排序方式,所以至少有N!个叶子节点

结论

计算模型:决策树(decision tree

成本模型:比较(compares)

上界:使用归并排序可以达到NlgN复杂度

下界:NlgN

最优算法:归并排序

归并算法的时间上界达到排序算法的时间下界;但耗费过多内存空间,从内存占用方面来讲并不是最优的。

影响排序复杂性的因素

  • 输入的起始顺序
    • 如果输入较为有序,则我们可能不需要NlgN次的比较(在数组完全有序的情况下,插入排序只要比较N-1次)
  • 重复元素
    • 如果输入带有重复元素,则我们可能不需要NlgN次的比较(使用3路快排(3-way quicksort))
  • 元素的数字属性(Digital properties of keys):我们可以用数字/特征比较(digit/character compares)来代替值比较(key compares)对数字和字符串进行比较

基于这些因素,可以根据数据的性质,来选择合适的排序算法。       

原文地址:https://www.cnblogs.com/Jimtastic/p/4003517.html