二分查找

一、前言

二分查找本身是个简单的算法，但是正是因为其简单，更容易写错。甚至于在二分查找算法刚出现的时候，也是存在bug的（溢出的bug），这个bug直到几十年后才修复（见《编程珠玑》）。本文打算对二分查找算法进行总结，并对由二分查找引申出来的问题进行分析和汇总。若有错误，请不吝赐教。

二、二分查找是这样的

相信大家都知道二分查找的基本算法，如下所示，这就是二分查找算法：

Cpp代码

int bisearch(int a[], int n, int t)  //数组a有序，长度为n， 待查找的值为t
{
    int l = 0, u = n - 1;
    while (l <= u) {
        int m = l + (u - l) / 2; //同（l+u）/ 2，这里是为了溢出
        if (t > a[m])
            l = m + 1;
        else if (t < a[m])
            u = m - 1;
        else
            return m;
    }
    return -(l+1);
}

算法的思想就是：从数组中间开始，每次排除一半的数据，时间复杂度为O(lgN)。这依赖于数组有序这个性质。如果t存在数组中，则返回t在数组的位置；否则，不存在则返回-（l+1）。

这里需要解释下为什么t不存在数组中时不是返回-1而要返回-(l+1)。首先我们可以观察l的值，如果查找不成功，则l的值恰好是t应该在数组中插入的位置。

举个例子，假定有序数组a={1, 3, 4, 7, 8}，那么如果t=0，则显然t不在数组中，则二分查找算法最终会使得l=0 > u=-1 退出循环；如果t=9，则t也不在数组中，则最后l=5 > u=4退出循环。如果t=5，则最后l=3 > u=2退出循环。因此在一些算法中，比如DHT（一致性哈希）中，就需要这个返回值来使得新加入的节点可以插入到合适的位置中，在求最长递增子序列的NlgN算法中，也用到了这一点，参见博文最长递增子序列算法。

还有一个小点就是之所以返回-（l+1）而不是直接返回-l是因为l可能为0，如果直接返回-l就无法判断是正常返回位置0还是查找不成功返回的0。

三、二分查找数字第一次出现的位置

现在考虑一个稍微复杂点的问题，如果有序数组中有重复数字，比如数组a={1, 2, 3, 3, 5, 7, 8}，需要在其中找出3第一次出现的位置。这里3第一次出现位置为2。这个问题在《编程珠玑》第九章有很好的分析，这里就直接用了。算法的精髓在于循环不变式的巧妙设计，代码如下：

Cpp代码

int bsearch_first(int a[], int n, int t)
{
    int l = -1, u = n;
    while (l + 1 != u) {
        /*循环不变式a[l]<t<=a[u] && l<u*/
        int m = l + (u - l) / 2; //同（l+u）/ 2
        if (t > a[m])
            l = m;
        else
            u = m;
    }
    /*assert: l+1=u && a[l]<t<=a[u]*/
    int p = u;
    if (p>=n || a[p]!=t)
        p = -1;
    return p;
}

算法分析：设定两个不存在的元素a[-1]和a[n]，使得a[-1] < t <= a[n]，但是我们并不会去访问者两个元素，因为(l+u)/2 > l=-1, (l+u)/2 < u=n。循环不变式为l<u && t>a[l] && t<=a[u] 。循环退出时必然有l+1=u, 而且a[l] < t <= a[u]。循环退出后u的值为t可能出现的位置，其范围为[0, n]，如果t在数组中，则第一个出现的位置p=u，如果不在，则设置p=-1返回。该算法的效率虽然解决了更为复杂的问题，但是其效率比初始版本的二分查找还要高，因为它在每次循环中只需要比较一次，前一程序则通常需要比较两次。

举个例子：对于数组a={1, 2, 3, 3, 5, 7, 8}，我们如果查找t=3，则可以得到p=u=2，如果查找t=4，a[3]<t<=a[4]，所以p=u=4，判断a[4] != t，所以设置p=-1.一种例外情况是u>=n, 比如t=9，则u=7，此时也是设置p=-1.
特别注意的是，l=-1，u=n这两个值不能写成l=0，u=n-1。虽然这两个值不会访问到，但是如果改成后面的那样，就会导致二分查找失败，那样就访问不到第一个数字。如在a={1，2，3，4，5}中查找1，如果初始设置l=0，u=n-1，则会导致查找失败。

扩展

如果要查找数字在数组中最后出现的位置呢？其实这跟上述算法是类似的，稍微改一下上面的算法就可以了，代码如下：

Cpp代码

int bsearch_last(int a[], int n, int t)
{
    int l = -1, u = n;
    while (l + 1 != u) {
        /*循环不变式, a[l] <= t < a[u]*/
        int m = l + (u - l) / 2;
        if (t >= a[m])
            l = m;
        else
            u = m;
    }
    /*assert: l+1 = u && a[l] <= t < a[u]*/
    int p = l;
    if (p<=-1 || a[p]!=t)
        p = -1;
    return p;
}

四、旋转数组元素查找问题

题目：把一个有序数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转。现在给出旋转后的数组和一个数，旋转了多少位不知道，要求给出一个算法，算出给出的数在该数组中的下标，如果没有找到这个数，则返回-1。要求查找次数不能超过n。

分析：由题目可以知道，旋转后的数组虽然整体无序了，但是其前后两部分是部分有序的。由此还是可以使用二分查找来解决该问题的。

解法一：:2次二分查找。首先确定数组分割点，也就是说分割点两边的数组都有序。比如例子中的数组以位置2分割，前面部分{3,4,5}有序，后半部分{1,2}有序。然后对这两部分分别使用二分查找即可。代码如下：

Cpp代码

int split(int a[], int n)
{
    for (int i=0; i<n-1; i++) {
        if (a[i+1] < a[i])
            return i;
    }
    return -1;
}

int bsearch_rotate(int a[], int n, int t)
{
    int p = split(a, n); //找到分割位置
    if (p == -1)
        return bsearch_first(a, n, t); //如果原数组有序，则直接二分查找即可
    else {
        int left = bsearch_first(a, p+1, t); //查找左半部分
        if (left == -1) {  //左半部分没有找到，则查找右半部分
            int right = bsearch_first(a+p+1, n-p-1, t); //查找右半部分
            if (right != -1) return right+p+1;  //返回位置，注意要加上p+1
            return -1;
        }
        return left; //左半部分找到，则直接返回
    }
}

解法二：1次二分查找。

二分查找算法有两个关键点：1）数组有序；2）根据当前区间的中间元素与x的大小关系，确定下次二分查找在前半段区间还是后半段区间进行。

仔细分析该问题，可以发现，每次根据low和high求出mid后，mid左边（[low, mid]）和右边（[mid, high]）至少一个是有序的。

a[mid]分别与a[left]和a[right]比较，确定哪一段是有序的。

如果左边是有序的，若x<a[mid]且x>a[left], 则right=mid-1；其他情况，left =mid+1；

如果右边是有序的，若x> a[mid] 且x<a[right] 则left=mid+1；其他情况，right =mid-1；

代码如下：

Cpp代码

int bsearch_rotate(int a[], int n, int t)

{

int low = 0, high = n-1;

while (low <= high) {

int mid = low + (high-low) / 2;

if (t == a[mid])

return mid;

if (a[mid] >= a[low]) { //数组左半有序

if (t >= a[low] && t < a[mid])

high = mid - 1;

else

low = mid + 1;

} else { //数组右半段有序

if (t > a[mid] && t <= a[high])

low = mid + 1;

else

high = mid - 1;

}

return -1;

}