动画详解十大经典排序算法

本文转载于 SegmentFault 社区
作者:FiTeen

https://mp.weixin.qq.com/s/qEc9cJv6wooTZybaUMS2jA

排序算法是程序员必备的基础知识,弄明白它们的原理和实现很有必要。本文中将通过非常细节的动画展示出算法的原理,配合代码更容易理解。

概述


由于待排序的元素数量不同,使得排序过程中涉及的存储器不同,可将排序方法分为两类:一类是内部排序,指的是待排序列存放在计算机随机存储器中进行的排序过程;另一类是外部排序,指的是待排序的元素的数量很大,以致内存一次不能容纳全部记录,在排序过程中尚需对外存进行访问的排序过程。
我们可以将常见的内部排序算法可以分成两类

比较类排序:通过比较来决定元素间的相对次序,时间复杂度为 O(nlogn)~O(n²)。属于比较类的有:

非比较类排序:不通过比较来决定元素间的相对次序,其时间复杂度可以突破 O(nlogn),以线性时间运行。属于非比较类的有:

名次解释:

时间/空间复杂度描述一个算法执行时间/占用空间与数据规模的增长关系
n待排序列的个数
r“桶”的个数(上面的三种非比较类排序都是基于“桶”的思想实现的)
d待排序列的最高位数
In-place原地算法,指的是占用常用内存,不占用额外内存。空间复杂度为 O(1) 的都可以认为是原地算法
Out-place非原地算法,占用额外内存
稳定性假设待排序列中两元素相等,排序前后这两个相等元素的相对位置不变,则认为是稳定的。

一、冒泡排序

冒泡排序(Bubble Sort),顾名思义,就是指越小的元素会经由交换慢慢“浮”到数列的顶端。

算法原理

1. 从左到右,依次比较相邻的元素大小,更大的元素交换到右边;
2. 从第一组相邻元素比较到最后一组相邻元素,这一步结束最后一个元素必然是参与比较的元素中最大的元素;
3. 按照大的居右原则,重新从左到后比较,前一轮中得到的最后一个元素不参与比较,得出新一轮的最大元素;
4. 按照上述规则,每一轮结束会减少一个元素参与比较,直到没有任何一组元素需要比较。

动图演示

代码实现

 1 void bubble_sort(int arr[], int n) {
 2     int i, j;
 3     for (i = 0; i < n - 1; i++) {
 4         for (j = 0; j < n - i - 1; j++) {
 5             if (arr[j] > arr[j + 1]) {
 6                 swap(arr, j, j+1);
 7             }
 8         }
 9     }
10 }

另一种更好的实现:(子函数形式请继续往下阅读原文作者的代码)

 1 int a[10]={10,3,23,45,12,67,44,22,33,18};
 2 n=10;
 3 
 4 for(i=1;i<n;i++)
 5 {
 6     flag=1;
 7     for(j=0;j<n-i;j++)
 8     {
 9         if(a[j]>a[j+1])
10         {
11             flag=0;
12             t=a[j]; a[j]=a[j+1]; a[j+1]=t;
13         }
14     }
15     if(flag==1) break;
16 }

算法分析

 
冒泡排序属于交换排序,是稳定排序,平均时间复杂度为 O(n²),空间复杂度为 O(1)。
但是我们常看到冒泡排序的最优时间复杂度是 O(n),那要如何优化呢?
我们可以用一个 flag 参数记录新一轮的排序中元素是否做过交换,如果没有,说明前面参与比较过的元素已经是正序,那就没必要再从头比较了。代码实现如下:

 1 void bubble_sort_quicker(int arr[], int n) {
 2     int i, j, flag;
 3     for (i = 0; i < n - 1; i++) {
 4         flag = 0;
 5         for (j = 0; j < n - i - 1; j++) {
 6             if (arr[j] > arr[j + 1]) {
 7                 swap(arr, j, j+1);
 8                 flag = 1;
 9             }
10         }
11         if (!flag) return;
12     }
13 }

、快速排序

快速排序(Quick Sort),是冒泡排序的改进版,之所以“快速”,是因为使用了分治法。它也属于交换排序,通过元素之间的位置交换来达到排序的目的。

基本思想

在序列中随机挑选一个元素作基准,将小于基准的元素放在基准之前,大于基准的元素放在基准之后,再分别对小数区与大数区进行排序。
一趟快速排序的具体做法是:
1. 设两个指针 i 和 j,分别指向序列的头部和尾部;
2. 先从 j 所指的位置向前搜索,找到第一个比基准小的值,把它与基准交换位置;
3. 再从 i 所指的位置向后搜索,找到第一个比基准大的值,把它与基准交换位置;
4. 重复 2、3 两步,直到 i = j。
仔细研究一下上述算法我们会发现,在排序过程中,对基准的移动其实是多余的,因为只有一趟排序结束时,也就是 i = j 的位置才是基准的最终位置。
由此可以优化一下算法
1. 设两个指针 i 和 j,分别指向序列的头部和尾部;
2. 先从 j 所指的位置向前搜索,找到第一个比基准小的数值后停下来,再从 i 所指的位置向后搜索,找到第一个比基准大的数值后停下来,把 i 和 j 指向的两个值交换位置;
3. 重复步骤 2,直到 i = j,最后将相遇点指向的值与基准交换位置。

动图演示

代码实现

这里取序列的第一个元素为基准。

 1 /* 选取序列的第一个元素作为基准 */
 2 int select_pivot(int arr[], int low) {
 3     return arr[low];
 4 }
 5 
 6 void quick_sort(int arr[], int low, int high) {
 7     int i, j, pivot;
 8     if (low >= high) return;
 9     pivot = select_pivot(arr, low);
10     i = low;
11     j = high;
12     while (i != j) {
13         while (arr[j] >= pivot && i < j) j--;
14         while (arr[i] <= pivot && i < j) i++;
15         if (i < j) swap(arr, i, j);
16     }
17     arr[low] = arr[i];
18     arr[i] = pivot;
19     quick_sort(arr, low, i - 1);
20     quick_sort(arr, i + 1, high);
21 }

算法分析

快速排序是不稳定排序,它的平均时间复杂度为 O(nlogn),平均空间复杂度为 O(logn)。
快速排序中,基准的选取非常重要,它将影响排序的效率。举个例子,假如序列本身顺序随机,快速排序是所有同数量级时间复杂度的排序算法中平均性能最好的,但如果序列本身已经有序或基本有序,直接选取固定位置,例如第一个元素作为基准,会使快速排序就会沦为冒泡排序,时间复杂度为 O(n^2)。为了避免发生这种情况,引入下面两种获取基准的方法:
随机选取
就是选取序列中的任意一个数为基准的值。

1 /* 随机选择基准的位置,区间在 low 和 high 之间 */
2 int select_pivot_random(int arr[], int low, int high) {
3     srand((unsigned)time(NULL));
4     int pivot = rand()%(high - low) + low;
5     swap(arr, pivot, low);
6     
7     return arr[low];
8 }

三者取中
就是取起始位置、中间位置、末尾位置指向的元素,对这三个元素排序后取中间数作为基准。

 1 /* 取起始位置、中间位置、末尾位置指向的元素三者的中间值作为基准 */
 2 int select_pivot_median_of_three(int arr[], int low, int high) {
 3     // 计算数组中间的元素的下标
 4     int mid = low + ((high - low) >> 1);
 5     // 排序,使 arr[mid] <= arr[low] <= arr[high]
 6     if (arr[mid] > arr[high]) swap(arr, mid, high);
 7     if (arr[low] > arr[high]) swap(arr, low, high);
 8     if (arr[mid] > arr[low]) swap(arr, low, mid);
 9     // 使用 low 位置的元素作为基准
10     return arr[low];
11 }

经验证明,三者取中的规则可以大大改善快速排序在最坏情况下的性能。

三、插入排序

直接插入排序(Straight Insertion Sort),是一种简单直观的排序算法,它的基本操作是不断地将尚未排好序的数插入到已经排好序的部分,好比打扑克牌时一张张抓牌的动作。
在冒泡排序中,经过每一轮的排序处理后,序列后端的数是排好序的;而对于插入排序来说,经过每一轮的排序处理后,序列前端的数都是排好序的。

基本思想

先将第一个元素视为一个有序子序列,然后从第二个元素起逐个进行插入,直至整个序列变成元素非递减有序序列为止。如果待插入的元素与有序序列中的某个元素相等,则将待插入元素插入大相等元素的后面。整个排序过程进行 n-1 趟插入。

动图演示

代码实现

1 void insertion_sort(int arr[], int n) {
2     int i, j, temp;
3     for (i = 1; i < n; i++) {
4         temp = arr[i];
5         for (j = i; j > 0 && arr[j - 1] > temp; j--)
6             arr[j] = arr[j - 1];
7         arr[j] = temp;
8     }
9 }

算法分析

插入排序是稳定排序,平均时间复杂度为 O(n²),空间复杂度为 O(1)。

四、希尔排序

希尔排序(Shell's Sort)是第一个突破 O(n²) 的排序算法,是直接插入排序的改进版,又称“缩小增量排序”(Diminishing Increment Sort)。它与直接插入排序不同之处在于,它会优先比较距离较远的元素。

基本思想

先将整个待排序列分割成若干个字序列分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。
子序列的构成不是简单地“逐段分割”,将相隔某个增量的记录组成一个子序列,让增量逐趟缩短,直到增量为 1 为止。

动图演示

代码实现

增量序列可以有各种取法,例如上面动图所示,增量序列满足 [n / 2, n / 2 / 2, ..., 1],n 是序列本身的长度,这也是一种比较流行的增量序列定义方式。这时希尔排序的算法可以通过下面的代码实现:

 1 void shell_sort_split_half(int arr[], int n) {
 2     int i, j, dk, temp;
 3     for (dk = n >> 1; dk > 0; dk = dk >> 1) {
 4         for (i = dk; i < n; i++) {
 5             temp = arr[i];
 6             for (j = i - dk; j >= 0 && arr[j] > temp; j -= dk)
 7                 arr[j + dk] = arr[j];
 8             arr[j + dk] = temp;
 9         }
10     }
11 }

增量序列也可以有其它的定义方式,那么希尔排序的实现可以归纳成这样:

 1 void shell_insert(int arr[], int n, int dk) {
 2     int i, j, temp;
 3     for (i = dk; i < n; i += dk) {
 4         temp = arr[i];
 5         j = i - dk;
 6         while (j >= 0 && temp < arr[j]) {
 7             arr[j + dk] = arr[j];
 8             j -= dk;
 9         }
10         arr[j + dk] = temp;
11     }
12 }
13 
14 void shell_sort(int arr[], int n, int dlta[], int t) {
15     int k;
16     for (k = 0; k < t; ++k) {
17         // 一趟增量为 dlta[k] 的插入排序
18         shell_insert(arr, n, dlta[k]);
19     }
20 }

算法分析

希尔排序是不稳定排序,它的分析是一个复杂的问题,因为它的运行时间依赖于增量序列的选择,它的平均时间复杂度为 O(n^1.3),最好情况是 O(n),最差情况是 O(n²)。空间复杂度为 O(1)。

五、选择排序

选择排序(Selection Sort)是一种简单直观的排序算法。它的基本思想就是,每一趟 n-i+1(i=1,2,...,n-1) 个记录中选取关键字最小的记录作为有序序列的第 i 个记录。

算法步骤

简单选择排序:
1. 在未排序序列中找到最小(大)元素,存放到排序序列的起始位置;2. 在剩余未排序元素中继续寻找最小(大)元素,放到已排序序列的末尾;3. 重复步骤 2,直到所有元素排序完毕。

动图演示

代码实现

 1 void selection_sort(int arr[], int n) {
 2     int i, j;
 3     for (i = 0; i < n - 1; i++) {
 4         int min = i;
 5         for (j = i + 1; j < n; j++) {
 6             if (arr[j] < arr[min])
 7                 min = j;
 8         }
 9         swap(arr, min, i);
10     }
11 }

算法分析

选择排序是不稳定排序,时间复杂度固定为 O(n²),因此它不适用于数据规模较大的序列。不过它也有优点,就是不占用额外的内存空间。

六、堆排序

堆排序(Heap Sort)是指利用堆这种数据结构所设计的一种排序算法。堆的特点:
1. 一颗完全二叉树(也就是会所生成节点的顺序是:从上往下、从左往右)

2. 每一个节点必须满足父节点的值不大于/不小于子节点的值

 

基本思想


实现堆排序需要解决两个问题:
1. 如何将一个无序序列构建成堆?

2. 如何在输出堆顶元素后,调整剩余元素成为一个新的堆?


以升序为例,算法实现的思路为:
1. 建立一个 build_heap 函数,将数组 tree[0,...n-1] 建立成堆,n 表示数组长度。函数里需要维护的是所有节点的父节点,最后一个子节点下标为 n-1,那么它对应的父节点下标就是 (n-1-1)/2。
2. 构建完一次堆后,最大元素就会被存放在根节点 tree[0]。将 tree[0] 与最后一个元素交换,每一轮通过这种不断将最大元素后移的方式,来实现排序。
3. 而交换后新的根节点可能不满足堆的特点了,因此需要一个调整函数 heapify 来对剩余的数组元素进行最大堆性质的维护。如果 tree[i] 表示其中的某个节点,那么 tree[2*i+1] 是左孩子,tree[2*i+2] 是右孩子,选出三者中的最大元素的下标,存放于 max 值中,若 max 不等于 i,则将最大元素交换到 i 下标的位置。但是,此时以 tree[max] 为根节点的子树可能不满足堆的性质,需要递归调用自身。

动图演示

代码实现

 1 void heapify(int tree[], int n, int i) {
 2     // n 表示序列长度,i 表示父节点下标
 3     if (i >= n) return;
 4     // 左侧子节点下标
 5     int left = 2 * i + 1;
 6     // 右侧子节点下标
 7     int right = 2 * i + 2;
 8     int max = i;
 9     if (left < n && tree[left] > tree[max]) max = left;
10     if (right < n && tree[right] > tree[max]) max = right;
11     if (max != i) {
12         swap(tree, max, i);
13         heapify(tree, n, max);
14     }
15 }
16 
17 void build_heap(int tree[], int n) {
18     // 树最后一个节点的下标
19     int last_node = n - 1;
20     // 最后一个节点对应的父节点下标
21     int parent = (last_node - 1) / 2;
22     int i;
23     for (i = parent; i >= 0; i--) {
24         heapify(tree, n, i);
25     }
26 }
27 
28 void heap_sort(int tree[], int n) {
29     build_heap(tree, n);
30     int i;
31     for (i = n - 1; i >= 0; i--) {
32         // 将堆顶元素与最后一个元素交换
33         swap(tree, i, 0);
34         // 调整成大顶堆
35         heapify(tree, i, 0);
36     }
37 }

算法分析

堆排序是不稳定排序,适合数据量较大的序列,它的平均时间复杂度为 Ο(nlogn),空间复杂度为 O(1)。
此外,堆排序仅需一个记录大小供交换用的辅助存储空间。

七、归并排序

归并排序(Merge Sort)是建立在归并操作上的一种排序算法。它和快速排序一样,采用了分治法。

基本思想

归并的含义是将两个或两个以上的有序表组合成一个新的有序表。也就是说,从几个数据段中逐个选出最小的元素移入新数据段的末尾,使之有序。
那么归并排序的算法我们可以这样理解:
假如初始序列含有 n 个记录,则可以看成是 n 个有序的子序列,每个子序列的长度为 1。然后两两归并,得到 n/2 个长度为2或1的有序子序列;再两两归并,……,如此重复,直到得到一个长度为 n 的有序序列为止,这种排序方法称为 二路归并排序,下文介绍的也是这种排序方式。

动图演示

代码实现

 1 /* 将 arr[L..M] 和 arr[M+1..R] 归并 */
 2 void merge(int arr[], int L, int M, int R) {
 3     int LEFT_SIZE = M - L + 1;
 4     int RIGHT_SIZE = R - M;
 5     int left[LEFT_SIZE];
 6     int right[RIGHT_SIZE];
 7     int i, j, k;
 8     // 以 M 为分割线,把原数组分成左右子数组
 9     for (i = L; i <= M; i++) left[i - L] = arr[i];
10     for (i = M + 1; i <= R; i++) right[i - M - 1] = arr[i];
11     // 再合并成一个有序数组(从两个序列中选出最小值依次插入)
12     i = 0; j = 0; k = L;
13     while (i < LEFT_SIZE && j < RIGHT_SIZE) arr[k++] = left[i] < right[j] ? left[i++] : right[j++];
14     while (i < LEFT_SIZE) arr[k++] = left[i++];
15     while (j < RIGHT_SIZE) arr[k++] = right[j++];
16 }
17 
18 void merge_sort(int arr[], int L, int R) {
19     if (L == R) return;
20     // 将 arr[L..R] 平分为 arr[L..M] 和 arr[M+1..R]
21     int M = (L + R) / 2;
22     // 分别递归地将子序列排序为有序数列
23     merge_sort(arr, L, M);
24     merge_sort(arr, M + 1, R);
25     // 将两个排序后的子序列再归并到 arr
26     merge(arr, L, M, R);
27 }

算法分析

归并排序是稳定排序它和选择排序一样,性能不受输入数据的影响,但表现比选择排序更好,它的时间复杂度始终为 O(nlogn),但它需要额外的内存空间,空间复杂度为 O(n)。

八、桶排序

桶排序(Bucket sort)是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。
桶排序的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(也有可能是使用别的排序算法或是以递归方式继续用桶排序进行排序)

算法步骤

1. 设置固定数量的空桶;

2. 把数据放在对应的桶内;

3. 分别对每个非空桶内数据进行排序;

4. 拼接非空的桶内数据,得到最终的结果。

动图演示

代码实现

 1 void bucket_sort(int arr[], int n, int r) {
 2     if (arr == NULL || r < 1) return;
 3 
 4     // 根据最大/最小元素和桶数量,计算出每个桶对应的元素范围
 5     int max = arr[0], min = arr[0];
 6     int i, j;
 7     for (i = 1; i < n; i++) {
 8         if (max < arr[i]) max = arr[i];
 9         if (min > arr[i]) min = arr[i];
10     }
11     int range = (max - min + 1) / r + 1;
12 
13     // 建立桶对应的二维数组,一个桶里最多可能出现 n 个元素
14     int buckets[r][n];
15     memset(buckets, 0, sizeof(buckets));
16     int counts[r];
17     memset(counts, 0, sizeof(counts));
18     for (i = 0; i < n; i++) {
19         int k = (arr[i] - min) / range;
20         buckets[k][counts[k]++] = arr[i];
21     }
22 
23     int index = 0;
24     for (i = 0; i < r; i++) {
25         // 分别对每个非空桶内数据进行排序,比如计数排序
26         if (counts[i] == 0) continue;
27         counting_sort(buckets[i], counts[i]);
28         // 拼接非空的桶内数据,得到最终的结果
29         for (j = 0; j < counts[i]; j++) {
30             arr[index++] = buckets[i][j];
31         }
32     }
33 }

算法分析


桶排序是稳定排序,但仅限于桶排序本身,假如桶内排序采用了快速排序之类的非稳定排序,那么就是不稳定的。

 

时间复杂度

桶排序的时间复杂度可以这样看:

  • n 次循环,每个数据装入桶
  • r 次循环,每个桶中的数据进行排序(每个桶中平均有 n/r 个数据)

假如桶内排序用的是选择排序这类时间复杂度较高的排序,整个桶排序的时间复杂度就是 O(n)+O(n²),视作 O(n²),这是最差的情况;
假如桶内排序用的是比较先进的排序算法,时间复杂度为 O(nlogn),那么整个桶排序的时间复杂度为 O(n)+O(r*(n/r)*log(n/r))=O(n+nlog(n/r))。
k=nlog(n/r),桶排序的平均时间复杂度为 O(n+k)。当 r 接近于 n 时,k 趋近于 0,这时桶排序的时间复杂度是最优的,就可以认为是 O(n)。
也就是说如果数据被分配到同一个桶中,排序效率最低;但如果数据可以均匀分配到每一个桶中,时间效率最高,可以线性时间运行。但同样地,桶越多,空间就越大。

空间复杂度

占用额外内存,需要创建 r 个桶的额外空间,以及 n 个元素的额外空间,所以桶排序的空间复杂度为 O(n+r)。

九、计数排序

计数排序(Counting Sort)是一种非比较性质的排序算法,利用了桶的思想。它的核心在于将输入的数据值转化为键存储在额外开辟的辅助空间中,也就是说这个辅助空间的长度取决于待排序列中的数据范围。
如何转化成桶思想来理解呢?
我们设立 r 个桶,桶的键值分别对应从序列最小值升序到最大值的所有数值。接着,按照键值,依次把元素放进对应的桶中,然后统计出每个桶中分别有多少元素,再通过对桶内数据的计算,即可确定每一个元素最终的位置。

算法步骤

1. 找出待排序列中最大值 max 和最小值 min,算出序列的数据范围 r = max - min + 1,申请辅助空间 C[r];
2. 遍历待排序列,统计序列中每个值为 i 的元素出现的次数,记录在辅助空间的第 i 位;
3. 对辅助空间内的数据进行计算(从空间中的第一个元素开始,每一项和前一项相加),以确定值为 i 的元素在数组中出现的位置;
4. 反向填充目标数组:将每个元素 i 放在目标数组的第 C[i] 位,每放一个元素就将 C[i] 减 1,直到 C 中所有值都是 0

图演示

代码实现

 1 void counting_sort(int arr[], int n) {
 2     if (arr == NULL) return;
 3     // 定义辅助空间并初始化
 4     int max = arr[0], min = arr[0];
 5     int i;
 6     for (i = 1; i < n; i++) {
 7         if (max < arr[i]) max = arr[i];
 8         if (min > arr[i]) min = arr[i];
 9     }
10     int r = max - min + 1;
11     int C[r];
12     memset(C, 0, sizeof(C));
13     // 定义目标数组
14     int R[n];
15     // 统计每个元素出现的次数
16     for (i = 0; i < n; i++) C[arr[i] - min]++;
17     // 对辅助空间内数据进行计算
18     for (i = 1; i < r; i++) C[i] += C[i - 1];
19     // 反向填充目标数组
20     for (i = n - 1; i >= 0; i--) R[--C[arr[i] - min]] = arr[i];
21     // 目标数组里的结果重新赋值给 arr
22     for (i = 0; i < n; i++) arr[i] = R[i];
23 }

算法分析

计数排序属于非交换排序,是稳定排序,适合数据范围不显著大于数据数量的序列。

时间复杂度

它的时间复杂度是线性的,为 O(n+r),r 表示待排序列中的数据范围,也就是桶的个数。可以这样理解:将 n 个数据依次放进对应的桶中,再从 r 个桶中把数据按顺序取出来。

空间复杂度

占用额外内存,还需要 r 个桶,因此空间复杂度是 O(n+r),计数排序快于任何比较排序算法,但这是通过牺牲空间换取时间来实现的。

十、基数排序

基数排序(Radix Sort)是非比较型排序算法,它和计数排序、桶排序一样,利用了“桶”的概念。基数排序不需要进行记录关键字间的比较,是一种借助多关键字排序的思想对单逻辑关键字进行排序的方法。比如数字100,它的个位、十位、百位就是不同的关键字。
那么,对于一组乱序的数字,基数排序的实现原理就是将整数按位数(关键字)切割成不同的数字,然后按每个位数分别比较。对于关键字的选择,有最高位优先法(MSD法)和最低位优先法(LSD法)两种方式。MSD 必须将序列先逐层分割成若干子序列,然后再对各子序列进行排序;而 LSD 进行排序时,不必分成子序列,对每个关键字都是整个序列参加排序。

算法步骤

以 LSD 法为例:
1. 将所有待比较数值(非负整数)统一为同样的数位长度,数位不足的数值前面补零2. 从最低位(个位)开始,依次进行一次排序
3. 从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列
如果要支持负数参加排序,可以将序列中所有的值加上一个常数,使这些值都成为非负数,排好序后,所有的值再减去这个常数。

 动图演示

代码实现

 1 // 基数,范围0~9
 2 #define RADIX 10
 3 
 4 void radix_sort(int arr[], int n) {
 5     // 获取最大值和最小值
 6     int max = arr[0], min = arr[0];
 7     int i, j, l;
 8     for (i = 1; i < n; i++) {
 9         if (max < arr[i]) max = arr[i];
10         if (min > arr[i]) min = arr[i];
11     }
12     // 假如序列中有负数,所有数加上一个常数,使序列中所有值变成正数
13     if (min < 0) {
14         for (i = 0; i < n; i++) arr[i] -= min;
15         max -= min;
16     }
17     // 获取最大值位数
18     int d = 0;
19     while (max > 0) {
20         max /= RADIX;
21         d ++;
22     }
23     int queue[RADIX][n];
24     memset(queue, 0, sizeof(queue));
25     int count[RADIX] = {0};
26     for (i = 0; i < d; i++) {
27         // 分配数据
28         for (j = 0; j < n; j++) {
29             int key = arr[j] % (int)pow(RADIX, i + 1) / (int)pow(RADIX, i);
30             queue[key][count[key]++] = arr[j];
31         }
32         // 收集数据
33         int c = 0;
34         for (j = 0; j < RADIX; j++) {
35             for (l = 0; l < count[j]; l++) {
36                 arr[c++] = queue[j][l];
37                 queue[j][l] = 0;
38             }
39             count[j] = 0;
40         }
41     }
42     // 假如序列中有负数,收集排序结果时再减去前面加上的常数
43     if (min < 0) {
44         for (i = 0; i < n; i++) arr[i] += min;
45     }
46 }

算法分析


基数排序是稳定排序,适用于关键字取值范围固定的排序。

时间复杂度

基数排序可以看作是若干次“分配”和“收集”的过程。假设给定 n 个数,它的最高位数是 d,基数(也就是桶的个数)为 r,那么可以这样理解:共进行 d 趟排序,每趟排序都要对 n 个数据进行分配,再从 r 个桶中收集回来。所以算法的时间复杂度为 O(d(n+r)),在整数的排序中,r = 10,因此可以简化成 O(dn),是线性阶的排序。

空间复杂度

占用额外内存,需要创建 r 个桶的额外空间,以及 n 个元素的额外空间,所以基数排序的空间复杂度为 O(n+r)。


 

计数排序 & 桶排序 & 基数排序


这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:
桶排序:每个桶存储一定范围的数值,适用于元素尽可能分布均匀的排序;

计数排序:每个桶只存储单一键值,适用于最大值和最小值尽可能接近的排序;
基数排序:根据键值的每位数字来分配桶,适用于非负整数间的排序,且最大值和最小值尽可能接近。



原文地址:https://www.cnblogs.com/huashanqingzhu/p/12350516.html