二分查找(java实现)

什么是二分查找?

二分查找(binary search)又叫折半查找,它是一种在有序数组中查找某一特定元素的搜索算法。

二分查找必要条件?

  • 必须为顺序存储结构;
  • 必须按关键字大小有序排列。

二分查找原理

使用二分查找算法找出arrays数组中8的位置

int[] arrays = new int[] {2,8,12,18,20,25,30,37,41,49,61};

将有序数组分为三个部分,分别为中间值前(中间值数之前的一组数据),中间值和中间值后(中间值之后的一组数据);将要查找的数与中间值的数相比较,等于则退出查找,小于则在中间值前进行比较,大于在在中间值后进行比较,依次递归,直至查找到对应的值为止;当要查找数据结构为偶数时,中间值mid应向下取整处理;上述arrays数组中间值为{25},中间值前为{2,8,12,18,20},中间值后为{30,37,41,49,61}。二分查找计算原理图,如下:

二分查找常用两种方式

非递归

public class BinarySearch {
    
    public static void main(String[] args) {
        Integer[] array = {5, 2, 10, 8, 7};
        //使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
        Arrays.sort(array);
        System.out.println(find(array, 7));
    }
    
    public static Boolean find(Integer[] array, Integer param) {
        int start = 0;
        int end = array.length - 1;
        int mid;
        
        while(start <= end) {
            //使用位运算是为了防止start+end溢出的情况
            mid = (start + end) >> 1;
            if(array[mid] == param) {
                return true;
            }
            
            //注意start、end一定要取当前mid值的前一位或后一位,以免出现死循环,比如start为3,end为4,mid=(start+end)/2一直为3,出现死循环
            if(array[mid] < param) {
                start = mid + 1;
            }else {
                end = mid - 1;
            }
        }
        
        return false;
    }
}

递归

public class Binarysearch {
    public static int rank(int key,int[] a)
    {
        return rank(key,a,0,a.length-1);
    }
     
    public static int rank(int key,int[] a,int lo, int hi)
    {
        if(lo>hi)//左边界下标比有边界下标大,则不符合条件,
            return -1;
        int mid = lo+(hi-lo)/2;
        if(key<a[mid])
            rank( key,a,lo,mid-1);
        else if(key>mid)
            rank(key,a,mid+1,hi);
        return mid;
    }
}

时间复杂度和空间复杂度

时间复杂度:

  • 最坏的情况下两种方式时间复杂度一样:O(log2 N);
  • 最好情况下为O(1);

空间复杂度:

算法的空间复杂度并不是计算实际占用的空间,而是计算整个算法的辅助空间单元的个数

  • 非递归方式:由于辅助空间是常数级别的所以:空间复杂度是O(1);
  • 递归方式:递归的次数和深度都是log2 N,每次所需要的辅助空间都是常数级别的:空间复杂度:O(log2N )。

二分查找中值(mid)计算 二分查找中值计算有两种方式:

int mid = (low + high) / 2;
int mid = low + (high - low) / 2;

上述两种算法看似第一种要简洁,第二种提取之后,跟第一种没有什么区别。但是实际上上述两种计算是有区别的,第一种的做法是在极端情况下计算的,(low + high)存在着溢出的风险,进而有可能得到错误的mid结果,导致程序错误;而第二种算法能够保证计算出来的mid值一定大于low、小于high,不存在溢出的问题。 针对第一种算法为了防止溢出问题,可以使用:int mid = (high + low) >>> 1; 解决此问题。

二分查找的优缺点:

  • 优点:比较次数少,查找速度快,平均性能好。
  • 缺点:必须有序,必须是数组。

引申

解决二分查找缺陷问题更好的方法是使用二叉查找树,最好自然是自平衡二叉查找树,既能高效的(O(n log n))构建有序元素集合,又能如同二分查找法一样快速(O(log n))的搜寻目标数。

问题

以上的二分查找解决不了如下几个问题:

变体一:查找第一个值等于给定值的元素

比如下面这样一个有序数组,其中,a[5],a[6],a[7] 的值都等于 8,是重复的数据。我们希望查找第一个等于 8 的数据,也就是下标是 5 的元素。

首先拿 8 与区间的中间值 a[4] 比较,8 比6 大,于是在下标 5 到 9 之间继续查找。下标 5 和 9 的中间位置是下标 7,a[7] 正好等于8,所以代码就返回了。尽管 a[7] 也等于 8,但它并不是我们想要找的第一个等于 8 的元素,因为第一个值等于 8的元素是数组下标为 5 的元素。
public class BinarySearch {

    public static void main(String[] args) {
        int[] array = { 5, 2, 10, 8, 7 };
        // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
        Arrays.sort(array);
        System.out.println(find(array, 10));
    }

    public static int find(int[] a, int value) {
        int low = 0;
        int high = a.length - 1;
        //注意终止条件为low>high,因为low==high的这个元素有可能就是需要被查找的。
        while (low <= high) {
            //这种写法主要为了防止(low+high)/2超过int的上限值
            int mid = low + ((high - low) >> 1);
            //如果a[mid]>value,说明只能存在于[low~mid-1]
            if (a[mid] > value) {
                high = mid - 1;
            //同理若a[mid]<value,说明只能存在于[mid+1~high]
            } else if (a[mid] < value) {
                low = mid + 1;
            //这时候a[mid]==value,但是不一定是第一个等于value的
            } else {
                //如果第一个元素等于value,很明显,那就返回第一个元素的地址。如果mid的前一个元素不等于value,直接返回,否则继续往前找
                if ((mid == 0) || (a[mid - 1] != value)) {
                    return mid;
                }else {
                    //否则low不变,high往前移动一位,继续寻找
                    high = mid - 1;
                }
            }
        }
        return -1;
    }
}

变体二:查找最后一个值等于给定值的元素

public class BinarySearch {

    public static void main(String[] args) {
        int[] array = { 5, 2, 10, 8, 7, 10 };
        // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
        Arrays.sort(array);
        System.out.println(find(array, 10));
    }

    public static int find(int[] a, int value) {
        int low = 0;
        int high = a.length - 1;
        //注意终止条件为low>high,因为low==high的这个元素有可能就是需要被查找的。
        while (low <= high) {
            //这种写法主要为了防止(low+high)/2超过int的上限值
            int mid = low + ((high - low) >> 1);
            //如果a[mid]>value,说明只能存在于[low~mid-1]
            if (a[mid] > value) {
                high = mid - 1;
            //同理若a[mid]<value,说明只能存在于[mid+1~high]
            } else if (a[mid] < value) {
                low = mid + 1;
            //这时候a[mid]==value,但是不一定是第一个等于value的
            } else {
                //如果最后一个元素等于value,很明显,那就返回最后一个元素的地址。如果mid的后一个元素不等于value,直接返回,否则继续往后找
                if ((mid == a.length - 1) || (a[mid + 1] != value)) {
                    return mid;
                }else {
                    //否则high不变,low往前移动一位,继续寻找
                    low = mid + 1;
                }
            }
        }
        return -1;
    }
}

变体三:查找第一个大于等于给定值的元素

在有序数组中,查找第一个大于等于给定值的元素。比如,数组中存储的这样一个序列:3,4,6,7,10。如果查找第一个大于等于 5 的元素,那就是 6。
public class BinarySearch {

    public static void main(String[] args) {
        int[] array = { 5, 2, 10, 8, 7, 10 };
        // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
        Arrays.sort(array);
        System.out.println(find(array, 6));
    }

    public static int find(int[] a, int value) {
        int low = 0;
        int high = a.length - 1;
        while (low <= high) {
            int mid = low + ((high - low) >> 1);
            if (a[mid] >= value) {
                //第一个元素就比目标值大,那结果就是第一个元素。或者mid的前一个元素小于value,那此时mid就是那个元素
                if (mid == 0 || a[mid - 1] < value) {
                    return mid;
                }else {
                    //否则将high往前移动一位,继续寻找
                    high = mid - 1;
                }
            } else {
                //如果a[mid]<value,那么元素只可能存在于[mid+1, high]
                low = mid + 1;
            }
        }
        return -1;
    }
}

变体四:查找最后一个小于等于给定值的元素

查找最后一个小于等于给定值的元素。比如,数组中存储了这样一组数据:3,5,6,8,9,10。最后一个小于等于 7 的元素就是6。
 
public class BinarySearch {

    public static void main(String[] args) {
        int[] array = { 5, 2, 10, 8, 7, 10 };
        // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
        Arrays.sort(array);
        System.out.println(find(array, 6));
    }

    public static int find(int[] a, int value) {
        int low = 0;
        int high = a.length - 1;
        while (low <= high) {
            int mid = low + ((high - low) >> 1);
            if (a[mid] > value) {
                // 将high往前移动一位,继续寻找
                high = mid - 1;
            } else {
                //如果mid是最后一个元素,肯定就是他了。或者mid后面那个元素大于value,此时返回mid
                if ((mid == a.length - 1) || (a[mid + 1] > value)) {
                    return mid;
                } else {
                    //否则low继续后移
                    low = mid + 1;
                }
            }
        }
        return -1;
    }
}
注:其实二分查找的重点就是在一轮没有查找到结果后,low以及high的值如何改变的问题
 
原文地址:https://www.cnblogs.com/alimayun/p/12523700.html