二分查找及其应用

概述

二分查找算法是一种效率极高的算法，也是为数不多时间复杂度在O（logn）量级的算法。算法思想并不难理解，但是某些细节却十分复杂，因而本文尝试从一个通用框架入手，通过对不同细节的填补，生成在三种情况下适用的不同框架。同时后边给了一些二分查找的里边，便于读者练习。

框架与说明

通用二分查找框架

框架处理过程：

1. 初始化：为left和right赋值
2. 循环退出条件
3. 比较中值和目标值关系，分情况处理
	1. 相等
	2. 小于
	3. 大于

代码框架如下：

int binarySearch(int [] nums,int target) {
    int left = 0, right = ...;
    
    while(...){
        //防止溢出等同于mid = (left +right)/2
        int mid = left + (right - left)/2; 
        if(nums[mid] == target) {
            ...
        }else if (nums[mid] < target) {
            left = ...
        }else if (nums[mid] > target) {
            right = ...
        }
    }
    return ...
}

分析上边的框架，可能有两个奇怪的地方：

第一个是mid的计算方法比较奇怪

第二个整个if判断过程中没有else分支

其实这两个问题也是二分查找的两个重要点。

针对第一点mid如果使用传统的写法mid = (left + right)/2确实比较容易理解，但left和right直接相加可能会导致上溢出的风险，因而需要使用mid = left + (right - left)/2。

第二个问题可能更多是一个技巧，因为二分查找思想可能很容易理解，但是细节却比较难以捉摸，因而在使用二分查找时要把所有情况用else if 写清楚，而不要出现else，这样可以清晰的展现出所有分支的细节，便于理解和排错。

同时，在整个模板中，我们可以看到有好多省略号...标记，这个是容易出现细节问题的地方，也是我们在使用二分查找需要尤为注意的问题，后边会结合一些简单实例，来说明一下这些细节会有那些变化。

基本二分查找

public int binarySearch(int[] nums, int target) {
    // 初始化，细节一：right此处复制为nums.length - 1，
    //相当于搜索区间为[left,righty]
    int left = 0, right = nums.length - 1;
    // 循环退出条件，细节二：由于细节一的原因，此处要使用left<=right
    //，从而保证能够搜索到right的位置
    while (left <= right) {
      // 计算中值
      int mid = left + (right - left) / 2;
      // 查找到目标结果直接返回对应索引的位置
      if (nums[mid] == target) {
        return mid;
      } else if (nums[mid] < target) {
        // 细节三：因为已经验证过mid位置，因此需要从[mid+1，right]区间开始查找
        left = mid + 1;
      } else if (nums[mid] > target) {
        // 细节四：原因同细节三
        right = mid - 1;
      }
    }
    // 区间内所有值都已搜索完毕，直接返回-1
    return -1;
  }

基于初始模板，我们可以很快写出基本的二分查找算法，但是针对实现过程中的一些细节，我们需要做一些说明：

为什么 while 循环的条件中是 <=,而不是 < ?

首先由于我们初始化的时候选择的右边界就是right = nums.length -1，也即右边界是可以被访问到的，所以我们在终止条件判断的时候需要加上这个等号，搜寻的时候，搜索区间为[left,right]一个闭区间。

这二者可能出现在不同功能的二分查找中,区别是:前者相当于两端都闭区间 [left, right],后者相当于左闭右开区间 [left, right),因为索引大小为nums.length 是越界的。

为什么 left = mid + 1,right = mid - 1?我看有的代码是 right = mid 或者left = mid,没有这些加加减减,到底怎么回事,怎么判断?

这个也是二分查找的重要细节，刚才我们说了此处的搜索区间是[left,right]，因此当判断mid之后，我们需要将搜索区间锁定在[left,mid-1]、[mid+1,right]这两个区间中。后一种用法可能会在左边界查找、右边界查找中会用到。

左边界查找

代码实现：

public int leftBound(int[] nums, int target) {
    // 细节1：right赋值为length，意味着搜索区间范围左闭右开
    int left = 0, right = nums.length;
    // 细节2
    while (left < right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] == target) {
            // 细节3
            right = mid;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            // 细节4
            right = mid;
        }
    }
    // 细节5
    return nums[left] == target ? left : -1;
}

左边界查找较之与基本二分查找多了几个细节点不同。

为什么 while(left < right) 而不是 <= ?

答:用相同的方法分析,因为 right = nums.length 而不是 nums.length - 1 。因此每次循环的「搜索区间」是 [left, right) 左闭右开。while(left < right) 终止的条件是 left == right,此时搜索区间 [left, left) 为空,
所以可以正确终止。

为何返回left？

答：因为搜索退出时一定是left==right因此即使返回的是right也影响不大。

右边界查找

代码实现：

public int rightBound(int[] nums, int target) {
    int left = 0, right = nums.length;
    while (left < right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] == target) {
            //细节1
            left = mid + 1;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid;
        }
    }
    //细节2
    return nums[left - 1] == target ? left - 1 : -1;
}

这个相比左边界查找可能有两个细节地方改变：

中点值和目标值相同时，不直接返回而是要通过left = mid + 1将查找区间向右逼近，进而才能查找最右侧的值
返回值是left -1 ，主要是因为，在找到目标值之后做了一个left = mid +1 操作，从而实际我们想要的mid的值为left -1。

典型例题

1. 寻找旋转排序数组中的最小值

基本思路：

在二分查找的过程中比较最左侧和最右侧值的大小，如果右侧小，则搜索【mid+1,right】区间，同时要注意一种情况，就是mid隔开了最小值，因此需要判断mid位置元素是否是最小的元素，如果不是将搜索区间改成【left，mid-1】。如果左侧小则直接搜索【left，mid-1】

代码实现：

 public int findMin(int[] nums) {
    int left = 0, right = nums.length - 1;
    int min = nums[left];
    while (left <= right) {
      int mid = ((right - left) >> 1) + left;
      if (nums[mid] < min) {
        min = nums[mid];
      }
      if (nums[left] < nums[right]) {
        right = mid - 1;
      } else if (nums[left] > nums[right]) {
        // 证明最小值在mid的前面
        if (mid > left && nums[mid] > nums[mid - 1]) {
          right = mid - 1;
        } else {
          left = mid + 1;
        }
      } else if (nums[left] == nums[right]) {
        return min;
      }
    }
    return min;

总结

通过对上边三种二分查找框架的掌握，大部分二分查找问题都可以解决，还是那句话，二分查找本身思想比较简单，但是细节很折磨人，但是针对某个问题，逐个分析其细节，最后大部分问题应该还是可以比较好的解决的。