数据结构---归并排序

此文转载自:https://blog.csdn.net/MEANSWER/article/details/113174244


数据结构—其他的排序(排序1)
链接: link.

数据结构—快速排序(排序2)
链接: link.

以上的排序方法适用于内存排序。
但是对于归并排序来说更适用于外存(磁盘)排序,当然也可以用作内存排序

1. 基本思想及实现过程

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。(简单点说:类似于一颗倒着的二叉树,你需要先分解到只剩下一个元素(此时默认这个元素就是有序的了),然后往回合并,那么当你最后所分的左右两半有序了,在一归并,整体就有序了

归并排序核心步骤:(分解是递归的过程:相当于二叉树的后续遍历,递归往回退是归并)
在这里插入图片描述
单趟排序的思想:把一个数组的元素分成两半,在开辟一个临时的数组,对于前一半数组定义一个begin1和end1,对于后一半数组来说定义一个begin2和end2,让begin1和begin2的值比大小,谁小就把谁拿到那个临时开辟数组中,然后相应的那个begin++,直到一个先走到end,剩下的那个数组的元素直接取下来就好。
在这里插入图片描述

1.1 完整代码

void _MergeSort(int* a,int left,int right,int* tmp)
{
	if (left >= right)
		return;
	//首先应该分成两半
	int mid = (left + right) / 2;
	//[left,mid] [mid+1,right] 有序则可以直接合并,现在他们没有序,子问题解决
	_MergeSort(a, left, mid, tmp);
	_MergeSort(a, mid+1,right, tmp);

	//归并
	int begin1 = left, end1 = mid;
	int begin2 = mid + 1, end2 = right;
	int index = begin1; //这一步是为了能保持一致,让放到tmp数组里面的和原先位置一样
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < a[begin2])
			tmp[index++] = a[begin1++];
		else
			tmp[index++] = a[begin2++];
	}
	//此时说明有一个组已经走完了
	while (begin1 <= end1)
		tmp[index++] = a[begin1++];

	while (begin2<= end2)
		tmp[index++] = a[begin2++];

	//把归并好的数据在拷贝回去
	for (int i = left; i <= right; ++i)
	{
		a[i] = tmp[i];
	}

}
//归并排序
void MergeSort(int* a, int n)
{
	assert(a);
	//这里归并的过程都是借助你所开辟的一大段空间来进行操作的
	int* tmp = (int*)malloc(sizeof(int)*n);

	_MergeSort(a,0,n-1,tmp);
	free(tmp);
}

2.归并的非递归

在这里插入图片描述

易错点:

  1. 这里我们为了好去类比于递归的方式写非递归,也选择使用闭区间来控制边界,如何去想要思考清楚
  2. 对于gap的思考。开始会认为gap是1,然后是2,在是4…但是你会发现这种情况是理想状况下(刚好数组的元素能对分),比如:当你的数组只有6个数的时候你会发现你开始gap是1是没有问题的,但是当你的gap为2的时候,后面一组是不知道去和谁合的,并且你的第二组区间可能会存在越界。还有就是比如数组元素位7个的时候,4个一合,第二组区间只有部分,区间需要修正。
void MergeArr(int* a,int begin1, int end1, int begin2, int end2, int* tmp)
{
	int left = begin1, right = end2;
	int index = begin1; 
	while (begin1 <= end1 && begin2 <= end2)// 因为这里是闭区间所以要加=
	{
		if (a[begin1] < a[begin2])
			tmp[index++] = a[begin1++];
		else
			tmp[index++] = a[begin2++];
	}
	//此时说明有一个组已经走完了
	while (begin1 <= end1)
		tmp[index++] = a[begin1++];

	while (begin2 <= end2)
		tmp[index++] = a[begin2++];

	//把归并好的数据在拷贝回去
	for (int i = left; i <= right; ++i)
	{
		a[i] = tmp[i];
	}
}

//归并的非递归
void MergeSortNonR(int* a, int n)
{
	assert(a);

	int* tmp = (int*)malloc(sizeof(int) * n);
	//怎样去控制这个gap,能让他们很好的归并?
	int gap = 1;
	while (gap < n)
	{
		for (int i = 0; i < n; i += 2 * gap) //这里的这个i控制,就是针对让它去合并后面的组
		{
			//此时先从一个一个归并开始思考,区间为[i,i+gap),[i+gap,i+2*gap) 开区间
			//但是为了和相面的思考方式保持一致这里使用闭区间好一些[i,i+gap-1],[i+gap,i+2*gap-1]
			int begin1 = i,end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;//针对可能会越界的情况,去判断边界
			//1.合并时只有第一组,那就不需要合并了
			if (begin2 >= n)
				break;
			//2.合并时第二组只有部分数据,需要修正end2边界
			if (end2 >= n)
				end2 = n - 1;
			MergeArr(a, begin1,end1,begin2,end2, tmp);  //这只是合并了第一数和第二个数
		}
		gap *= 2;
	}
	free(tmp);
}

3. 排序算法复杂度及稳定性分析

在这里插入图片描述
在这里插入图片描述
(这里是有一个错误的,对于选择排序来说是不稳定的

对于希尔排序来说,时间复杂度是O(N1.3 )~O( N2),这个是确定的,但是这个数值O(N1.3 )和O(nolgn)是非常接近的。所以有很多人认为这个数值是O(nlogn)

稳定性:数组中相同值,排完序相对顺序可以做到不变就是稳定的,否则就不稳定。

   

更多内容详见微信公众号:Python测试和开发

Python测试和开发

原文地址:https://www.cnblogs.com/phyger/p/14340348.html