P1627 [CQOI2009]中位数题解

CSDN同步

原题链接

简要题意：

给定一个 (1) ~ (n) 的排列，求以 (b) 为中位数的 连续子序列且长度为奇数 的个数。

显然这段序列包含 (b).

中位数的定义：排序后在最中间的数。

算法一

对于 (30 \%) 的数据，(n leq 100).

由于这段序列一定包含 (b)，那么我们可以枚举区间 ([i,j]) 包含 (b)（有类似于双指针），然后单独取出 ([i,j]) 这段进行排序，暴力判断即可。

时间复杂度：(O(n^3 log n)).

实际得分：(30pts).

算法二

对于 (60 \%) 的数据，(n leq 1000).

显然我们不需要每次都把 ([i,j]) 这段取出，可以一次次扩展。

比方说枚举 (i) （从 (d) 到 (1)，(d) 是 (b) 的位置），然后枚举 (j) 从 (d) 到 (n). 对于每个 (j)，只需在原来数组的基础上添上一个 (a_j) 即可；如果 (j=n) 的话，添加之后要把数组清空。

那么每次只需要插入一个数的话，我们可以用 插入排序，因为已经排序的是有序的，因为插入的位置可以用二分算出。插入操作我们不用数组维护，用 ( ext{vector}) 维护会方便很多。

时间复杂度：(O(n^2 log n)).

实际得分：(60pts).

算法三

对于 (60 \%) 的数据，(n leq 1000).

抛开排序过程，我们想：因为排列的性质，不存在重复数。所以，一个连续序列的中位数为 (b) 当且仅当比 (b) 大的数的个数和比 (b) 小的数的个数相等。 那么，对于 (d) 的左边，线性 ( ext{dp}) ，用 (f_i) 表示 (i) ~ (d) 比 (i) 大的数的个数，(g_i) 是小的，同理 (d) 的右边也推一遍。

那么，我们枚举左右端点 (i,j) 只需要 (O(1)) 判断即可。即 (f_i + g_i = f_j + g_j).

时间复杂度：(O(n^2)).

实际得分：(60pts).

算法四

对于 (60 \%) 的数据，(n leq 1000).

从算法三的 ( ext{dp}) 上入手，我们发现，(f_i + g_i = f_j + g_j) 等价于 (f_i - f_j = g_i - g_j). 所以我们只需要算出 比 (b) 大的数的个数与比 (b) 小的数的个数之差 重新作为 (f) 数组的状态，然后枚举端点即可。

时间复杂度：(O(n^2)).

实际得分：(60pts).

算法五

对于 (100 \%) 的数据，(n leq 10^5).

从算法四上再优化一下，其实对于固定的一个左端点 (i)，我们只需要算出有多少个 (j geq d) 且 (f_i = f_j) 即可。

也就是说，我们需要维护 区间查询相等个数。

智商不够，数据结构来凑。所以这个查询我们可以用 ( ext{Treap}) 或者 ( ext{Splay}) 来实现。（随便用个平衡树板子都能实现的）

时间复杂度：(O(n log n)).

实际得分：(100pts).

算法六

对于 (100 \%) 的数据，(n leq 10^5).

从算法五上入手，你发现 区间查询相等个数 是静态查询，不需要修改。那你可以用 权值线段树（主席树） 解决本题。

时间复杂度：(O(n log n)).

实际得分：(100pts).

算法七

对于 (100 \%) 的数据，(n leq 10^5).

在算法六的基础上，你发现不仅是静态，而且是固定的一个区间 ([d,n]). 那么我们不需要用 权值线段树（可以理解为 (n) 棵线段树），只需要 (1) 棵线段树即可。

时间复杂度：(O(n log n)).

实际得分：(100pts).

算法八

对于 (100 \%) 的数据，(n leq 10^5).

如果你的程序在算法七止步不前，只能说明你是个天才，离最后的成功只差几步了。

固定区间维护静态相等个数，听上去很高大上啊，其实不就是个 ( ext{map}) 吗？

~~某同学：我还能 %$#^%*(%&))~~

嗯，改成 ( ext{map}) 之后感觉简单多了，是不是？然后我们直接省去 (f) 数组，直接存入 ( ext{map}).

时间复杂度：(O(n log n)).

实际得分：(100pts).

//为了看起来清晰 , 用了嵌套三目运算符
// q[tot+=((a[i]>b)?1:(a[i]<b)?-1:0)]++; 其实相当于这几句：
// if(a[i]>b) tot++; 
// if(a[i]<b) tot--;
// q[tot]++;
#pragma GCC optimize(2)
#include<bits/stdc++.h>
using namespace std;

typedef long long ll;
const int N=1e5+1;

inline int read(){char ch=getchar();int f=1;while(ch<'0' || ch>'9') {if(ch=='-') f=-f; ch=getchar();}
	int x=0;while(ch>='0' && ch<='9') x=(x<<3)+(x<<1)+ch-'0',ch=getchar();return x*f;}

int n,b,wz,a[N];
int tot,sum; ll ans=0;
map<int,int> q;

int main(){
	n=read(),b=read();
	for(int i=1;i<=n;i++) a[i]=read(),wz=(a[i]==b)?i:wz;
	for(int i=wz;i<=n;i++) q[tot+=((a[i]>b)?1:(a[i]<b)?-1:0)]++;
	for(int i=wz;i>=1;i--) ans+=q[0-(sum+=(a[i]>b)?1:((a[i]<b)?-1:0))];
	printf("%lld
",ans);
	return 0;
}

算法九

对于 (200 \%) 的数据，(n leq 10^7).

（实际上是本人的一个加强）

算法八的基础上，我们可以尝试拿掉这个 (log).

但是你很快发现下标虽然不超过 (10^7)，但是会有负数，可能有 (-10^7).

显然，哈希处理负下标 是这题的最终正解。

把每个下标都加上 (n)，解决负下标之后 (O(1)) 查询，拿掉 ( ext{map}) 还解决了 (log).

时间复杂度：(O(n)).

实际得分：(200pts).

P1627 [CQOI2009]中位数 题解

算法一

算法二

算法三

算法四

算法五

算法六

算法七

算法八

算法九

P1627 [CQOI2009]中位数题解