归并排序

归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。

归并过程为：比较a[i]和a[j]的大小，若a[i]≤a[j]，则将第一个有序表中的元素a[i]复制到r[k]中，并令i和k分别加上1；否则将第二个有序表中的元素a[j]复制到r[k]中，并令j和k分别加上1，如此循环下去，直到其中一个有序表取完，然后再将另一个有序表中剩余的元素复制到r中从下标k到下标t的单元。归并排序的算法我们通常用递归实现，先把待排序区间[s,t]以中点二分，接着把左边子区间排序，再把右边子区间排序，最后把左区间和右区间用一次归并操作合并成有序的区间[s,t]。

以上内容来自百度百科。

归并排序主要分为两部分：

1、划分子区间

2、合并子区间

现在以 9,6,7,22,20,33,16,20 为例讲解上面两个过程：

第一步，划分子区间：每次递归都从中间把数据划分为左区间和右区间。

原始区间为[start,end],start=0,end=[length-1]，减一是因为数组的下标从0开始，本例中length=8,end=7。现在从中间元素划分，划分之后的左右区间分别为 [start,(end-start+1)/2+start]，右区间为[(end-start+1)/2+start+1,end]，本例中把start和end带入可以得到[0,7]，划分后的左右子区间为[0,4],[5,7]，然后分别对[start,end]=[0,4]和[start,end]=[5,7]重复上一步过程，直到每个子区间只有一个或者两个元素。

整个分解过程为:

子区间划分好以后，分别对左右子区间进行排序，排好序之后，在递归的把左右子区间进行合并，整个过程如下图所示：

代码：

void mergeSubArry(vector<int> &a, int st, int ed, vector<int> &r)
{
    int st1=st;
    int ed1=(st+ed)/2;
    int st2=ed1+1;
    int ed2=ed;
    int rInd=st;
    //r[st]~r[ed]为合并后的序列;
    while(st1<=ed1 && st2<=ed2)
    {
        if (a[st1]<a[st2])
        {
            r[rInd++]=a[st1++];
        }
        else
        {
            r[rInd++]=a[st2++];
        }
    }
    while (st1<=ed1)
    {
        r[rInd++]=a[st1++];
    }
    while(st2<=ed2)
    {
        r[rInd++]=a[st2++];
    }

    //注意，不要忘记把合并后的序列复制到原数组中，因为每次二路合并操作的都是之前合并好的子序列;
    for (int i=st;i<=ed;i++)
    {
        a[i]=r[i];
    }
}

void corefun(vector<int> &a,int st,int ed, vector<int> &r)
{
    //划分子数组;
    if (ed-st<1)//若划分子序列至一个元素，结束当前划分;
    {
        return ;
    }
    if (ed-st==1)//若划分子序列至两个元素，排序后结束后当前划分;
    {
        if (a[ed]<a[st])
        {
            swap(a[st],a[ed]);
        }
        return ;
    }
    int mid=(st+ed)/2;
    corefun(a,st,mid,r);
    corefun(a,mid+1,ed,r);

    //合并子数组;
    mergeSubArry(a,st,ed,r);

    //把合并后的序列复制到原数组中也可以在此处操作;
    /*for (int i=st;i<=ed;i++)
    {
        a[i]=r[i];
    }*/

}


void mergeSort(vector<int> &a)
{
    int size=a.size();
    vector<int> r=a;
    corefun(a,0,size-1,r);
}

下面进行测试，测试代码如下，输入【1,4,3,2,5,8,7,6】：

void main()
{
    vector<int> test1;
    test1.push_back(1);
    test1.push_back(4);
    test1.push_back(3);
    test1.push_back(2);
    test1.push_back(5);
    test1.push_back(8);
    test1.push_back(7);
    test1.push_back(6);

    mergeSort(test1);

    cout<<"排序后的数组："<<endl;
    for (int i=0;i<test1.size();i++)
    {
        cout<<test1[i]<<" ";
    }
    cout<<endl;
}

输出：

PS：最开始实现时没有在merge函数中将合并好的子序列拷贝赋值到原数组中，而是直接在最后的sort函数中将r中元素拷贝给a数组，导致结果错误。原因是，每次merge中合并的序列都应该是之前合并好的序列，而不是未经改变的原始数组。

其他参考：常见排序算法C++总结

代码优化：划分子序列时，可以直接划分到一个元素。另外，还可以少定义一个函数，直接将合并序列部分与划分序列部分放到一个函数里（参数都相同）。

代码：

void sortfun(vector<int> &a,int st,int ed, vector<int> &r)
{
    //划分子序列，若划至只有一个元素，结束划分;
    if (ed-st<1)
    {
        return ;
    }

    int mid=(st+ed)/2;
    int st1=st;
    int ed1=mid;
    int st2=mid+1;
    int ed2=ed;
    
    sortfun(a,st1,ed1,r);
    sortfun(a,st2,ed2,r);

    //合并子数组,r[st]~r[ed]为合并后的序列;
    int rInd=st;
    while(st1<=ed1 && st2<=ed2)
    {
        if (a[st1]<a[st2])
        {
            r[rInd++]=a[st1++];
        }
        else
        {
            r[rInd++]=a[st2++];
        }
    }
    while (st1<=ed1)
    {
        r[rInd++]=a[st1++];
    }
    while(st2<=ed2)
    {
        r[rInd++]=a[st2++];
    }

    //注意，不要忘记把合并后的序列复制到原数组中，因为每次二路合并操作的都是之前合并好的子序列;
    for (int i=st;i<=ed;i++)
    {
        a[i]=r[i];
    }
}


void mergeSort(vector<int> &a)
{
    int size=a.size();
    vector<int> r=a;
    sortfun(a,0,size-1,r);
}