3. 快速排序

　　快速排序（Quick Sort）与冒泡排序均为交换类排序。快排是对冒泡排序的一种改进。由于关键字的比较和交换是跳跃进行的，因此，快速排序是一种不稳定的排序方法。

0. 序

1. 冒泡排序

2. 快速排序

2.1 基本思想

2.2 一趟快速排序（一趟划分）

2.3 过程

2.4 实现

2.5 复杂度分析

2.5.1 时间复杂度（包含证明）

2.5.2 空间复杂度

0. 序

　　快速排序算法最早由图灵奖获得者Tony Hoare设计出来的，他在形式化方法理论以及ALGOL60编程语言的发明中都有卓越的贡献，是上世纪最伟大的计算机科学家之一。

　　快速排序被列为20世纪十大算法之一。

　　1. 冒泡排序

　　假设在排序过程中，记录序列R[1...n] 的状态为：

　　更多的冒泡排序讲解见https://www.cnblogs.com/datamining-bio/p/9715774.html

　　2. 快速排序

　　快速排序也是通过不断比较和移动交换来实现排序的，只不过它的实现，增大了记录的比较和移动的距离，将关键字较大的记录从前面直接移动到后面，关键字较小的记录从后面直接移动到前面，从而减少了总的比较次数和移动交换次数。

　　2.1 基本思想

　　通过一趟排序将待排记录分割成独立的两部分，其中一部分记录的关键字均比另一部分记录的关键字小，然后分别对这两部分继续进行排序，直到整个序列有序。

　　2.2 一趟快速排序（一次划分）

　　目标：找一个记录，以它的关键字作为“枢纽”，凡其关键字小于枢纽的记录均移动至该记录之前，反之，凡关键字大于枢纽的记录均移动至该记录之后。

　　设 R[s] = 52 为枢纽

　　将R[high].key 和枢纽的关键字进行比较，要求R[high].key ≥ 枢纽的关键字

　　将R[low].key 和枢纽的关键字进行比价，要求R[low].key ≤ 枢纽的关键字

　　可见，经过“一次划分”，将关键字序列：

　　52, 49， 80， 36， 14， 58， 61， 97， 23， 75

　　调整为： 23， 49， 14， 36，（52），58, 61，97, 80， 75

　　在调整过程中，设立了两个指针：low 和 high，它们的初值分别为：s 和 t

　　之后逐渐减小high，增加low，并保证 R[high].key ≥ 52，和 R[low].key ≤ 52，否则进行记录的“交换”。

　　2.3 过程

　　首先对无序的记录序列进行“一次划分”，之后分别对分割所得两个子序列“递归”进行快速排序。

　　2.4 实现

// 快速排序  O(nlogn) --->逆序O(n^2)
// 调用QSort(1, n)   待排记录index = 1 ... n
public int[] QSort(int low, int high){
    if(low < high){
        int p = Partition(low, high);
        QSort(low, p-1);
        QSort(p+1, high);
    }
    return needSort;
}
private int Partition(int low, int high){
    needSort[0] = needSort[low];
    while(low < high){
        while(low < high && needSort[high] >= needSort[0]) high--;
        needSort[low] = needSort[high];
        while(low < high && needSort[low] <= needSort[0]) low++;
        needSort[high] = needSort[low];
    }
    needSort[low] = needSort[0];
    return low;
}

　　2.5 复杂度分析

　　2.5.1 时间复杂度

　　① 在最优情况下，Partition每次都划分得很均匀，如果排序n个关键字，其递归树（见2.5.2）的深度就为，即仅需递归log₂n次，需要时间为T(n)的话，第一次Partition应该是需要对整个数组扫描一遍，做n次比较。然后，获得的枢纽将数组一分为二，那么各自还需要T(n/2)的时间（注意是最好情况，所以平分两半）。于是不断地划分下去，我们就有了下面的不等式推断。　

T(n) ≤ 2T(n/2) + n, T(1) = 0

T(n) ≤ 2( 2T(n/4) + n/2 ) + n = 4T(n/4) + 2n

T(n) ≤ 4( 2T(n/8) + n/4 ) + 2n = 8T(n/8) + 3n

...

T(n) ≤ nT(1) + (log₂n) * n = O(nlogn)

　　不知道为什么是“≤”而不是“＝”？待补充

　　也就是说，在最优的情况下，快速排序算法的时间复杂度为O(nlogn)。

　　② 在最坏情况下，待排序的序列为正序或逆序，每次划分只得到一个比上一次划分少一个记录的子序列，注意另一个为空。如果递归树画出来，它是一颗斜树。此时需要执行n-1次递归调用，且第i次划分需要经过n-i次关键字的比较才能找到第i个记录，也就是枢纽的位置，因此比较次数为，最终其时间复杂度为O(n²)。

　　③ 平均的情况，设枢纽的关键字应该在第k的位置（1≤k≤n），每个位置的概率相同，均为1/n，那么：

　　数学归纳法可证明，其数量级为O(nlogn)。待补充

　　通常，快速排序被认为是在所有同数量级O(nlogn) 的排序方法中，其平均性能是最好的。但是，若待排记录的初始状态为按关键字有序或基本有序时，快速排序将蜕化为冒泡排序，其时间复杂度为O(n²)。

　　为避免出现这种情况，需在进行一次划分之前，进行“预处理”，即：先对R(s),key， R(t).key和 R[└(s+t)/2┘].key，进行相互比较，然后取关键字为“三者之中”的记录为枢纽记录。

　　2.5.2 空间效率

　　举例：

　　快速排序的递归过程可用生成一颗二叉树形象地给出，下图对应上面例子递归调用过程的二叉树。

　　快速排序是递归的，每层递归调用时的指针和参数均要用栈来存放，递归调用层数与上述二叉树的深度一致。因而，存储开销在理想情况下为O(log₂n)，即树的高度，其空间复杂度也就为O(logn)；在最坏情况下，需要进行n-1次递归调用，即二叉树是一个单链，为O(n)；平均情况，空间复杂度也为O(logn)。

　　注意，由于关键字的比较和交换是跳跃进行的，因此，快速排序是一种不稳定的排序方法。

参考：

　　上课ppt

　　《大话数据结构》程杰著清华大学出版社，2011.6（2017.6 重印）