小Z的袜子(bzoj 2038)

Description

作为一个生活散漫的人,小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天,小Z再也无法忍受这恼人的找袜子过程,于是他决定听天由命……
具体来说,小Z把这N只袜子从1到N编号,然后从编号L到R(L 尽管小Z并不在意两只袜子是不是完整的一双,甚至不在意两只袜子是否一左一右,他却很在意袜子的颜色,毕竟穿两只不同色的袜子会很尴尬。
你的任务便是告诉小Z,他有多大的概率抽到两只颜色相同的袜子。当然,小Z希望这个概率尽量高,所以他可能会询问多个(L,R)以方便自己选择。

Input

输入文件第一行包含两个正整数N和M。N为袜子的数量,M为小Z所提的询问的数量。接下来一行包含N个正整数Ci,其中Ci表示第i只袜子的颜色,相同的颜色用相同的数字表示。再接下来M行,每行两个正整数L,R表示一个询问。

Output

包含M行,对于每个询问在一行中输出分数A/B表示从该询问的区间[L,R]中随机抽出两只袜子颜色相同的概率。若该概率为0则输出0/1,否则输出的A/B必须为最简分数。(详见样例)

Sample Input

6 4
1 2 3 3 3 2
2 6
1 3
3 5
1 6

Sample Output

2/5
0/1
1/1
4/15
【样例解释】
询问1:共C(5,2)=10种可能,其中抽出两个2有1种可能,抽出两个3有3种可能,概率为(1+3)/10=4/10=2/5。
询问2:共C(3,2)=3种可能,无法抽到颜色相同的袜子,概率为0/3=0/1。
询问3:共C(3,2)=3种可能,均为抽出两个3,概率为3/3=1/1。
注:上述C(a, b)表示组合数,组合数C(a, b)等价于在a个不同的物品中选取b个的选取方案数。
【数据规模和约定】
30%的数据中 N,M ≤ 5000;
60%的数据中 N,M ≤ 25000;
100%的数据中 N,M ≤ 50000,1 ≤ L < R ≤ N,Ci ≤ N。
/*
  莫队算法的经典题目,并借此简述一下对该算法的理解。 
  莫队算法是一个离线算法,如果某个区间(x,y)的信息可以用O(1)的时间转移,莫队算法便可上场。
  我们将序列分为√n块,将操作按照x所在的块为第一关键字,y为第二关键字进行排序,这样可以
  保证相邻两个操作之间的转移是O(√n)的,如果不是√n,那么说明这个块以后不会询问到了,所以
  可以保证均摊时间复杂度。
  
  下面看这个题目。
  我们设区间(x,y)中的各种颜色数目为a,b,c...,由C(x,2)=x*(x-1)/2可知,最后的答案为: 
    (a*(a-1)+b*(b-1)+c*(c-1)+...)/((y-x+1)*(y-x))
  =>(a*a+b*b+c*c...-(y-x+1))/((y-x+1)*(y-x))
  观察上式可知我们只需维护所有颜色数目的平方就可以了,可以做到O(1)转移。 
*/
#include<iostream>
#include<cstdio>
#include<cmath>
#include<algorithm>
#define N 100010
#define lon long long
using namespace std;
int col[N],bl[N],n,m;
lon num[N],ans,up[N],down[N];
struct node{int l,r,id;}a[N];
bool cmp(const node&s1,const node&s2){
    if(bl[s1.l]==bl[s2.l]) return s1.r<s2.r;
    return bl[s1.l]<bl[s2.l];
}
void init(int x,int d){
    ans-=num[col[x]]*num[col[x]];
    num[col[x]]+=(lon)d;
    ans+=num[col[x]]*num[col[x]];
}
lon gcd(lon aa,lon bb){
    if(!bb) return aa;
    return gcd(bb,aa%bb);
}
int main(){
    scanf("%d%d",&n,&m);
    int len=sqrt(n);
    for(int i=1;i<=n;i++){
        scanf("%d",&col[i]);
        bl[i]=(i-1)/len+1;
    }
    for(int i=1;i<=m;i++){
        scanf("%d%d",&a[i].l,&a[i].r);
        a[i].id=i;
    }
    sort(a+1,a+m+1,cmp);
    int pl=1,pr=0;
    for(int i=1;i<=m;i++){
        int id=a[i].id;
        if(a[i].l==a[i].r){
            up[id]=0;down[id]=1;continue;
        }
        if(a[i].l>pl){
            for(int j=pl;j<a[i].l;j++)
                init(j,-1);
        }
        else {
            for(int j=a[i].l;j<pl;j++)
                init(j,1);
        }
        pl=a[i].l;
        if(a[i].r>pr){
            for(int j=pr+1;j<=a[i].r;j++)
                init(j,1);
        }
        else {
            for(int j=a[i].r+1;j<=pr;j++)
                init(j,-1);
        }
        pr=a[i].r;
        lon aa=ans-(lon)(a[i].r-a[i].l+1);
        lon bb=(lon)(a[i].r-a[i].l+1)*(lon)(a[i].r-a[i].l);
        lon cc=gcd(aa,bb);
        up[id]=aa/cc;down[id]=bb/cc;
    }
    for(int i=1;i<=m;i++)
        printf("%lld/%lld
",up[i],down[i]);
    return 0;
}
原文地址:https://www.cnblogs.com/harden/p/6435735.html