【bzoj2038】 小Z的袜子(hose)

http://www.lydsy.com/JudgeOnline/problem.php?id=2038 (题目链接)

转自:http://blog.csdn.net/bossup/article/details/39236275

题意

  给出n个数以及m个区间,求在每个区间内选出两个数,有多大的概率使选出的两个数相等。

solution

  对于${L,R}$的询问。设其中颜色为${x,y,z….}$的袜子的个数为${a,b,c….}$那么答案即为$${frac{a*frac{a-1}{2}+b*frac{b-1}{2}+c*frac{c-1}{2}….}{frac{(R-L+1)(R-L)}{2}}}$$

  化简得:$${frac{a^2+b^2+c^2+…x^2-(a+b+c+d+…..)}{(R-L+1)(R-L)}}$$
  即:$${frac{a^2+b^2+c^2+…x^2-(R-L+1)}{(R-L+1)(R-L)}}$$

  所以这道题目的关键是求一个区间内每种颜色数目的平方和。

  但问题时怎么快速求解呢?

  对于一般区间维护类问题一般想到用线段树。但是这题完全不知道线段树怎么做,所以只能用莫队算法了。

  莫队算法是离线处理一类区间不修改查询类问题的算法。就是如果你知道了${[L,R]}$的答案。你可以在${O(1)}$的时间下得到${[L,R-1]}$和${[L,R+1]}$和${[L-1,R]}$和${[L+1,R]}$的答案的话。就可以使用莫队算法。

  对于莫队算法其实就是暴力。只是预先知道了所有的询问。可以合理的组织计算每个询问的顺序以此来降低复杂度。要知道我们算完${[L,R]}$的答案后现在要算${[L’,R’]}$的答案。由于可以在${O(1)}$的时间下得到${[L,R-1]}$和${[L,R+1]}$和${[L-1,R]}$和${[L+1,R]}$的答案。所以计算${[L’,R’]}$的答案花的时间为${|L-L’|+|R-R’|}$。如果把询问${[L,R]}$看做平面上的点${a(L,R)}$;询问${[L’,R’]}$看做点${b(L’,R’)}$的话。那么时间开销就为两点的曼哈顿距离。所以对于每个询问看做一个点。我们要按一定顺序计算每个值。那开销就为曼哈顿距离的和。要计算到每个点。那么路径至少是一棵树。所以问题就变成了求二维平面的最小曼哈顿距离生成树。

  关于二维平面最小曼哈顿距离生成树。感兴趣的可以参考【poj3241】 Object Clustering 

  这样只要顺着树边计算一次就ok了。可以证明时间复杂度为${n*sqrt{n}}$这个我不会证明。 

  但是这种方法编程复杂度稍微高了一点。所以有一个比较优雅的替代品。那就是先对序列分块。然后对于所有询问按照${L}$所在块的大小排序。如果一样再按照${R}$排序。然后按照排序后的顺序计算。为什么这样计算就可以降低复杂度呢。 

  一、${i}$与${i+1}$在同一块内,${r}$单调递增,所以${r}$是${O(n)}$的。由于有${sqrt{n}}$块,所以这一部分时间复杂度是${n^{1.5}}$。 

  二、${i}$与${i+1}$跨越一块,${r}$最多变化${n}$,由于有${sqrt{n}}$块,所以这一部分时间复杂度是${n^{1.5}}$。 

  三、${i}$与${i+1}$在同一块内时${l}$变化不超过${sqrt{n}}$,跨越一块也不会超过${2*sqrt{n}}$,不妨看作是${sqrt{n}}$。由于有${n}$个数,所以时间复杂度是${n^{1.5}}$。 

  所以复杂度就变成${O(n*sqrt{n})}$。

代码

// bzoj2038
#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdlib>
#include<cstdio>
#include<cmath>
#define MOD 1000000007
#define inf 2147483640
#define LL long long
#define free(a) freopen(a".in","r",stdin);freopen(a".out","w",stdout);
using namespace std;
inline LL getint() {
    LL x=0,f=1;char ch=getchar();
    while (ch>'9' || ch<'0') {if (ch=='-') f=-1;ch=getchar();}
    while (ch>='0' && ch<='9') {x=x*10+ch-'0';ch=getchar();}
    return x*f;
}

const int maxn=50010;
struct data {LL a,b;int l,r,id;}t[maxn];
int n,m,pos[maxn],a[maxn];
LL s[maxn],ans;

bool cmp1(data a,data b) {
    return pos[a.l]==pos[b.l]?a.r<b.r:pos[a.l]<pos[b.l];
}
bool cmp2(data a,data b) {
    return a.id<b.id;
}
void update(int p,int val) {
    ans-=s[a[p]]*s[a[p]];
    s[a[p]]+=val;
    ans+=s[a[p]]*s[a[p]];
}
LL gcd(LL x,LL y) {
    return x%y==0?y:gcd(y,x%y);
}
int main() {
    scanf("%d%d",&n,&m);
    for (int i=1;i<=n;i++) scanf("%d",&a[i]);
    int block=int(sqrt(n));
    for (int i=1;i<=n;i++) pos[i]=(i-1)/block+1;
    for (int i=1;i<=m;i++) {
        scanf("%d%d",&t[i].l,&t[i].r);
        t[i].id=i;
    }
    sort(t+1,t+1+m,cmp1);
    for (int i=1,l=1,r=0;i<=m;i++) {
        for (;r<t[i].r;r++) update(r+1,1);
        for (;r>t[i].r;r--) update(r,-1);
        for (;l<t[i].l;l++) update(l,-1);
        for (;l>t[i].l;l--) update(l-1,1);
        if (t[i].l==t[i].r) {t[i].a=0,t[i].b=1;continue;}
        t[i].a=ans-(t[i].r-t[i].l+1);
        t[i].b=(LL)(t[i].r-t[i].l+1)*(t[i].r-t[i].l);
        LL k=gcd(t[i].a,t[i].b);
        t[i].a/=k;t[i].b/=k;
    }
    sort(t+1,t+1+m,cmp2);
    for (int i=1;i<=m;i++) printf("%lld/%lld
",t[i].a,t[i].b);
    return 0;
}

  

原文地址:https://www.cnblogs.com/MashiroSky/p/5914637.html