[知识点] 2.5 二分思想

总目录 > 2 算法基础 > 2.5 二分思想

前言

一个当时了解得相当晚的思想，乍一看好像和分治差不多味道，其实本质区别还是很大的，当时甚至还有混淆。二分主要是用于二分查找和二分答案，这里还会提一下三分。

子目录列表

1、二分与分治

2、二分查找

3、二分答案

4、三分

2.5 二分思想

1、二分与分治

在前面，我们已经提过了分治思想（请参见：2.2 递归与分治），其核心在于对问题进行分解，解决，最后再合并。二分听起来好像是属于分治的一种，但一个最表象的差异在于——分治是递归的，而二分不是；而且，不论是适用情况还是思想核心，两者并无直接关系，下面来看看二分思想是如何体现的。

2、二分查找

二分查找法，又称折半查找法，是在有序数列中查找特定元素的算法。

假设数列为 a[] = {1, 2, 3, 5, 8, 13, 21, 34, 55}，共 9 个数，现在需要查找 55这个数。

如果使用简单的枚举方法来查找，则显然是 O(n) 的，而二分查找能使其降为 O(log n)。

第一轮 a[1..9]：

mid = (1 + 9) / 2 = 5，则第 5 个数为中间值。

a[5] = 8 < 55，则说明 55 必然在中间值的右半部分，因为数列是单调的，则右半部分都是 >= 8 而左半部分都是 <= 8 的。

而对于左右半部分的定义，通常将 [1, mid) 定义为左半部分，即包含中间值，而右半部分定义为 (mid, r]。

第二轮 a[6..9]：

mid = (6 + 9) / 2 = 7（这里采用向下取整），则第 7 个数为中间值。

a[7] = 21 < 55，则说明 55 必然在中间值的右半部分。

第三轮 a[8..9]:

mid = (8 + 9) / 2 = 8，则第 8 个数为中间值。

a[8] = 34 < 55，则说明 55 必然在中间值的右半部分。

第四轮 a[9..9]:

l = r，则可以直接比较，a[9] = 55 = 55，得到答案，返回。

图解：

注意到，二分查找属于整数集上的二分，二分的值是离散的，所以有时其中间值可能是个小数取整，则并非完全均等二分。

代码：

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 #define MAXN 2005
 5 
 6 int n, a[MAXN], o, l, r, mid, ans = -1;
 7 
 8 int main() {
 9     cin >> n;
10     for (int i = 1; i <= n; i++) cin >> a[i];
11     cin >> o;
12     l = 1, r = n;
13     while (l <= r) {
14         mid = (l + r) >> 1;
15         if (o > a[mid]) l = mid + 1;
16         else if (o < a[mid]) r = mid - 1;
17         else {
18             ans = mid;
19             break;
20         }
21     }
22     cout << ans;
23     return 0;
24 }

（代码中的 >> 1 和 / 2 等价，但是速度更快，请参见：6.1位运算与进位制）

然而，这种最基本的二分却只能解决无重复元素的情况，比如在 a[] = {1, 2, 2, 2, 4} 中查找 2 的话，这种二分只能找到第三位的 2，这个问题出在进行二分时的边界设定问题。

将核心代码稍微修改一下：

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 #define MAXN 2005
 5 
 6 int n, a[MAXN], o, l, r, mid;
 7 
 8 int main() {
 9     cin >> n;
10     for (int i = 1; i <= n; i++) cin >> a[i];
11     cin >> o;
12     l = 1, r = n + 1;
13     while (l < r) {
14         mid = (l + r) >> 1;
15         if (o > a[mid]) l = mid + 1;
16         else r = mid;
17     }
18     cout << l;
19     return 0;
20 }

注意出现了如下几个不同：

① L12: r = n + 1（原为 r = n）

② L13: l < r（原 l <= r）

③ L16: o < a[mid] 时，r = mid（原 r = mid - 1）

④ L16: o = a[mid] 时不返回，而是和 a < a[mid] 时一样 r = mid

下面来解释下原因：

原来的二分算法中，我们对于每一个区间的 l 和 r，其实是表示 [l, r]，即左右均是闭的；而在这里，l 和 r 表示的区间时 [l, r)，是不包括 r 的，这样，对于 ① 和 ③，就不难理解为何要在原基础上 + 1；对于 ②，因为原来的 l <= r 是将 l > r 作为终止条件，而现在是 l == r 时也可以终止了，因为 l == r 时 [l, r) 并无意义。

④ 的区别是关键——在原来的算法中，我们是只要找到相等元素就完工退出，而现在我们即便是找到了，依旧向左半部分的区间继续寻找，目的是找到最左端的相等元素。

下面给出两个图来体现两种二分的查找结果的区别：

如果需要找最右端的呢？把上述所有对右端点的修改改成左端点就行了。

3、二分答案

除了查找元素，二分的作用还可以扩展到更广。上述的二分，是在有序离散的数据中查找一个特定值。

先注意到这个“有序”，如果对于一个数列，其一侧均满足某种条件，而另一侧均不满足，其实也可以看作一种有序，而任务就从查找某个特定元素变成找到满足与不满足之间的分界线。

见如下例题：

【POJ2456】【Aggressive cows】一条线段上有 n 个点，选取 m 个点，使得任意相邻点之间距离中的最小值最大（题目大意）。

看起来毫无头绪，起码之前我是不知道这就是二分的模板题：我们先假设这个最小值的最大值为 k，则说明我们选取的这 m 个点任意相邻距离均不会超过 k；同时，也说明如果这个值大于 k，则必然选不到 m 个点；而如果这个值小于 k，则不是最优解。这听起来好像满足上面对于二分算法的使用条件：一侧均满足，一侧均不满足，而这个 k，就是这个分界线。

k 值最小可能为 1，最大可能为这 n 个点的最左端和最右端的距离，将它们设为初始区间的 l 和 r，然后进行二分，直到找到 k 值。

代码：

 1 #include <iostream>
 2 #include <cstdio>
 3 #include <algorithm> 
 4 using namespace std;
 5 
 6 #define MAXN 100005
 7 
 8 int n, m, a[MAXN], l, r, ans;
 9 
10 bool judge(int k) {
11     int o = a[1], tot = 1;
12     for (int i = 2; i <= n; i++)
13         if (a[i] - o >= k) {
14             o = a[i], tot++;
15             if (tot >= m) {
16                 ans = k; 
17                 return 1;
18             }
19         }
20     return 0;
21 }
22 
23 int main() {
24     while (~scanf("%d %d", &n, &m)) {
25         for (int i = 1; i <= n; i++) cin >> a[i];
26         sort(a + 1, a + n + 1);
27         l = 1, r = a[n] - a[1];
28         while (l <= r) {
29             int mid = (l + r) >> 1;
30             judge(mid) ? l = mid + 1 : r = mid - 1;
31         }
32         cout << ans << endl;
33     }
34     return 0;
35 }

这种类型的求解，称作“二分答案”。而这种类型的题目，是二分答案最经典的题型之一——最小值最大（或最大值最小）的求解。

和查找元素的一点区别在于，元素是确定的，找到了可以直接返回；而找分界线不同，二分过程只能得知满足与不满足，所以要尽可能无限逼近答案。

再来说“离散”。上述查找元素和例题，元素本身都是离散的，所以还延伸出了开区间和闭区间的结果差异，但二分同样可以处理连续的数据，即可以出现浮点数。处理浮点数方便在二分时左右端点直接赋值为 mid 即可，但同时要注意由于存在精度问题，所以循环条件写 l <= r 是不合适的，而应根据题目的精度要求写成诸如 abs(l - r) <= 1e-6（l 和 r 的差值小于 10 ^ -6）的形式。这里不单独给出例子，可以大概参考下面的三分的例题便是连续的。

二分思想本身是通俗易懂的，但是细节比较多，对于左右端点的转移方式和终止条件的书写都是因题而异的，在做题时要多加留意，实在不行可以多试几种不同的情况进行调试。

4、三分

一种我还从未应用过的玄学操作。二分是用来求单调序列的特定值，而三分是用来求凸函数的最值。直接看一道例题来体会：

【Luogu P3382】【三分法】给出一个 n 次函数，保证在范围 [l, r] 内存在一点 x，使得 [l, x] 上单调递增，[x, r] 上单调递减。试求出 x。

随手搓了个函数，来展现一下三分法的神奇：

首先将给出的 l 和 r 作为左右端点，然后算出区间的两个三等分点 lmid, rmid；

对比 f(lmid) 和 f(rmid) 的值，如果 f(lmid) < f(rmid)，则答案在 [lmid, r] 中，否则在 [l, rmid] 中，再进一步三分。为什么这样判断呢？

如上图所示，如果 lmid 和 rmid 分别在最值的两边，那么答案则必然在 [lmid, rmid] 之中，所以其实不论选那一部分都是一样的；

而如果 lmid 和 rmid 在最值的同一侧，如果满足 f(lmid) < f(rmid)，则必然存在 f(lmid) < f(rmid) < max，那么 max 属于 [lmid, r] 就显而易见了；反之亦然。

代码：

 1 #include <bits/stdc++.h> 
 2 using namespace std;
 3 
 4 #define MAXN 15
 5 
 6 int n;
 7 double l, r, a[MAXN];
 8 
 9 double f(double o) {
10     double res = 0, x = 1;
11     for (int i = n + 1; i >= 1; i--)
12         res += x * a[i], x *= o;
13     return res;
14 }
15 
16 int main() {
17     cin >> n >> l >> r;
18     for (int i = 1; i <= n + 1; i++) cin >> a[i];
19     while (abs(l - r) > 1e-6) {
20         double lmid = l + (r - l) / 3.0;
21         double rmid = r - (r - l) / 3.0;
22         f(lmid) < f(rmid) ? l = lmid : r = rmid;
23     }
24     cout << fixed << setprecision(5) << l;
25     return 0;
26 }