一、几种简单排序算法

数组的一个逆序指数组中位置

每次交换相邻元素可以消除一个逆序，通过交换相邻元素进行排序的任何算法平均需要

插入排序

插入排序是最简单的排序算法。插入排序由

 1 void insertion_sort(int a[], int n)
 2 {
 3     int i, j;
 4     int t;
 5 
 6     for (i = 1; i < n; i++) {
 7         t = a[i];
 8         for (j = i; j > 0 && a[j-1] > t; j--)
 9             a[j] = a[j-1];
10         a[j] = t;   //上面那句代码仅是替换掉前面一个
11         //swap(a[j] , a[j-1]);此条语句可以替换上面两条语句，但是调用了库函数
12     }
13 }

插入排序的平均运行时间为

冒泡排序

冒泡排序每趟从后到前比较相邻元素的大小，将较小值交换到前面，就像冒泡一样。冒泡排序和插入排序的交换次数相同。最坏时间复杂度：O（N2）

1 void bubble_sort(tp a[], int n)
2 {
3     int i, j;
4 
5     for (i = 0; i < n - 1; i++)
6         for (j = n - 1; j > i; j--)
7             if (a[j] < a[j-1])
8                 swap(&a[j], &a[j-1]);
9 }

选择排序

选择排序和冒泡排序有些类似，但交换次数较少，每趟记住位置

 1 void selection_sort(tp a[], int n)
 2 {
 3     int i, j, min;
 4 
 5     for (i = 0; i < n - 1; i++) {
 6         min = i;
 7         for (j = n - 1; j > i; j--)
 8             if (a[j] < a[min])
 9                 min = j;
10         swap(&a[i], &a[min]);
11     }
12 }

希尔排序

　　希尔排序通过比较相距一定间隔的元素来工作，每趟比较所用的间隔随算法的进行而减小，直到最后比较相邻元素，因此也称为缩小增量排序。它使用一个增量序列

　　一趟增量序列的一个常见选择是希尔增量，

 1 void shell_sort(tp a[], int n)
 2 {
 3     int i, j, incr;
 4     tp t;
 5 
 6     for (incr = n / 2; incr > 0; incr /= 2)
 7         for (i = incr; i < n; i++) {
 8             t = a[i];
 9             for (j = i; j >= incr && a[j-incr] > t; j -= incr)
10                 a[j] = a[j-incr];
11             a[j] = t;
12         }
13 }

使用希尔增量时希尔排序的最坏运行时间为

　　希尔增量因为未必互素，所以较小的增量可能影响很小。Hibbard提出了另一个增量序列，

　　希尔排序编程简单，性能也可以接受，因此是一个常用的排序算法。

堆排序

堆排序利用堆数据结构进行排序，它可以达到

static void perc_down(tp a[], int i, int n)
{
    int j;
    tp t;

    for (t = a[i]; i*2 + 1 < n; i = j) {
        j = i * 2 + 1;
        if (j != n - 1 && a[j+1] > a[j])
            j++;
        if (t < a[j])
            a[i] = a[j];
        else
            break;
    }
    a[i] = t;
}

void heap_sort(tp a[], int n)
{
    int i;

    for (i = n / 2; i >= 0; i--)    /* build max-heap */
        perc_down(a, i, n);
    for (i = n - 1; i > 0; i--) {
        swap(&a[0], &a[i]);
        perc_down(a, 0, i);
    }
}

注意这里的堆不使用标记，数据从位置0开始，因此位置

堆排序是一种非常稳定的算法，它最多使用

归并排序

归并排序以

static void merge(tp a[], tp ta[], int l, int r, int rend)
{
    int lend, t, i;

    lend = r - 1;
    t = i = l;
    while (l <= lend && r <= rend) {
        if (a[l] <= a[r])
            ta[t++] = a[l++];
        else
            ta[t++] = a[r++];
    }
    while (l <= lend)
        ta[t++] = a[l++];
    while (r <= rend)
        ta[t++] = a[r++];
    for (; i <= rend; i++)
        a[i] = ta[i];
}

static void merge_sort_rec(tp a[], tp ta[], int l, int r)
{
    int m;

    if (l < r) {
        m = (l + r) / 2;
        merge_sort_rec(a, ta, l, m);
        merge_sort_rec(a, ta, m+1, r);
        merge(a, ta, l, m+1, r);
    }
}

void merge_sort(tp a[], int n)
{
    tp *ta;

    ta = malloc(sizeof(tp)*n);
    if (ta == NULL)
        err_quit("malloc error.");
    merge_sort_rec(a, ta, 0, n-1);
    free(ta);
}

归并排序的运行时间满足：

T (1) = 1

T (N) = 2 T (N / 2) + N

可以解得

T (N) = N log N + N = O (N log N)

归并排序的缺点在于使用了附加存储，并且数据在数组间复制也减慢了排序的速度。可以通过在递归的交替层次交换数组和临时数组的角色来减少复制。但通常内部排序更多地选择快速排序，合并则常常用于外部排序算法。

快速排序

　　1、快速排序是已知的实际中最快的算法，平均运行时间为

如果
取
将
返回

　　2、枢纽元的选取：枢纽元素的选择会很大地影响快速排序的性能。一种安全的选择是随机地选取。枢轴的最好选择是数组的中值，但这很困难，一般选择左、中、右三个位置的中值作为枢轴。

　　3、分割策略：分割时，将枢纽元素和最右元素交换位置，然后对枢轴元素前面的元素从两边遍历，跳过已经正确划分的元素，交换划分相反的元素，直到遍历位置交错，再将最右的枢轴元素交换回中间。对枢轴分割的左右两部分递归地执行快速排序。需要注意的是对于相等的元素，也应该停止遍历并交换，这样可以保证每趟遍历后左右两部分的大小接近相等，达到分治的作用。

　　对于小数组（

 1 static tp median3(tp a[], int l, int r)
 2 {
 3     int m = (l + r) / 2;
 4 
 5     if (a[l] > a[m])
 6         swap(&a[l], &a[m]);
 7     if (a[l] > a[r])
 8         swap(&a[l], &a[r]);
 9     if (a[m] > a[r])
10         swap(&a[m], &a[r]);
11     swap(&a[m], &a[r-1]);
12     return a[r-1];
13 }
14 
15 static void quick_sort_rec(tp a[], int l, int r)
16 {
17     tp pivot;
18     int i, j;
19 
20     if (l + 3 <= r) {
21         pivot = median3(a, l, r);
22         i = l;
23         j = r - 1;
24         while (1) {
25             while (a[++i] < pivot);
26             while (a[--j] > pivot);
27             if (i < j)
28                 swap(&a[i], &a[j]);
29             else
30                 break;
31         }
32         swap(&a[i], &a[r-1]);
33         quick_sort_rec(a, l, i-1);
34         quick_sort_rec(a, i+1, r);
35     }
36     else
37         insertion_sort(a+l, r-l+1);
38 }
39 
40 void quick_sort(tp a[], int n)
41 {
42     quick_sort_rec(a, 0, n-1);
43 }

1、快速排序满足：

T (N) = T (i) + T (N - i - 1) + c N

其中，

2、最坏情况下，枢轴始终是最小元素，

T (N) = T (N - 1) + c N, N > 1

可得

3、最好情况时，枢轴正好位于中间，近似有

T (N) = 2 T (N / 2) + c N

可得

4、对于平均情况，假设对于

T (N) = 2 N ⎡⎣ \sum j = 0 N - 1 T ( j ) ⎤⎦ + c N

可得

快速选择

　　对于查找第

采用快速选择，可以得到一个更好的时间界。快速选择和快速排序原理相同，区别是它只使用一个递归。快速选择的最坏运行时间和快速排序的相同，为

static void quick_select_rec(tp a[], int k, int l, int r)
{
    tp pivot;
    int i, j;

    if (l + 3 <= r) {
        pivot = median3(a, l, r);
        i = l;
        j = r - 1;
        while (1) {
            while (a[++i] < pivot);
            while (a[--j] > pivot);
            if (i < j)
                swap(&a[i], &a[j]);
            else
                break;
        }
        swap(&a[i], &a[r-1]);
        if (k <= i)
            quick_select_rec(a, k, l, i-1);
        else if (k > i + 1)
            quick_select_rec(a, k, i+1, r);
    }
    else
        insertion_sort(a+l, r-l+1);
}

void quick_select(tp a[], int k, int n)
{
    quick_select_rec(a, k, 0, n-1);
}
小结：可以多个排序算法混合使用，对于大数据，比如先快排，然后进行插入排序!

二、排序的一般下界

　　可以证明，任何只用到比较的排序算法在最坏情况下需要

　　可以用决策树来证明。决策树是用于证明下界的抽象概念，这里它是一棵二叉树，每个节点表示元素之间的一组可能的排序，树的边表示比较的结果。只使用比较的排序算法都可以用决策树表示，算法所使用的比较次数等于最深的树叶的深度。

　　用数学归纳法可以证明，深度为

　　可以推广得到一个一般定理：如果存在

　　某些特殊情况下以线性时间进行排序是可能的，一个例子是桶式排序。桶式排序需要一些额外的信息，输入数据必须由小于

外部排序

　　输入数据太大，内存装不下只能外部排序。大部分内部排序都利用了内存直接寻址，但如果输入数据在磁盘上，I/O读取会造成实际上效率很低。外部排序对设备的依赖要严重得多。以磁带为例，可以以正反两个方向进行有效访问。假设至少有三个磁带来进行排序工作。外部排序的基础是归并排序。

2路合并

这是最简单的情况。设有四个磁带

该算法需要

多路合并

如果有更多的磁带，可以扩充2路合并为多路合并。

完成初始顺串的构造后，使用

多项合并

替换选择

关于顺串的生成，有一个替换选择的方法。读入到内存的

替换选择平均会产生长度为

排序总结

【前言】此篇是《数据结构和算法》的第七章读书笔记：排序

一、几种简单排序算法

插入排序

冒泡排序

选择排序

希尔排序

堆排序

归并排序

快速排序

快速选择

二、排序的一般下界

外部排序

2路合并

多路合并

多项合并

替换选择

排序总结

【前言】此篇是《数据结构和算法》的第七章读书笔记 ：排序

一、几种简单排序算法

插入排序

冒泡排序

选择排序

希尔排序

堆排序

归并排序

快速排序

快速选择

二、排序的一般下界

外部排序

2路合并

多路合并

多项合并

替换选择

【前言】此篇是《数据结构和算法》的第七章读书笔记：排序