[2009国家集训队]小Z的袜子(hose) 浅谈莫队

浅谈莫队

借用题目： bzoj 2038 2009 国家集训队小Z的袜子http://www.lydsy.com/JudgeOnline/problem.php?id=2038

[2009国家集训队]小Z的袜子(hose)

http://www.lydsy.com/JudgeOnline/problem.php?id=2038

Time Limit: 20 Sec  Memory Limit: 259 MB

Description

作为一个生活散漫的人，小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天，小Z再也无法忍受这恼人的找袜子过程，于是他决定听天由命……
具体来说，小Z把这N只袜子从1到N编号，然后从编号L到R(L 尽管小Z并不在意两只袜子是不是完整的一双，甚至不在意两只袜子是否一左一右，他却很在意袜子的颜色，毕竟穿两只不同色的袜子会很尴尬。
你的任务便是告诉小Z，他有多大的概率抽到两只颜色相同的袜子。当然，小Z希望这个概率尽量高，所以他可能会询问多个(L,R)以方便自己选择。

Input

输入文件第一行包含两个正整数N和M。N为袜子的数量，M为小Z所提的询问的数量。接下来一行包含N个正整数Ci，其中Ci表示第i只袜子的颜色，相同的颜色用相同的数字表示。再接下来M行，每行两个正整数L，R表示一个询问。

Output

包含M行，对于每个询问在一行中输出分数A/B表示从该询问的区间[L,R]中随机抽出两只袜子颜色相同的概率。若该概率为0则输出0/1，否则输出的A/B必须为最简分数。（详见样例）

Sample Input

6 4
1 2 3 3 3 2
2 6
1 3
3 5
1 6
Sample Output

2/5
0/1
1/1
4/15
【样例解释】
询问1：共C(5,2)=10种可能，其中抽出两个2有1种可能，抽出两个3有3种可能，概率为(1+3)/10=4/10=2/5。
询问2：共C(3,2)=3种可能，无法抽到颜色相同的袜子，概率为0/3=0/1。
询问3：共C(3,2)=3种可能，均为抽出两个3，概率为3/3=1/1。
注：上述C(a, b)表示组合数，组合数C(a, b)等价于在a个不同的物品中选取b个的选取方案数。
【数据规模和约定】
30%的数据中 N,M ≤ 5000；
60%的数据中 N,M ≤ 25000；
100%的数据中 N,M ≤ 50000，1 ≤ L < R ≤ N，Ci ≤ N。

题目简介

莫队算法

本方法由莫涛提出，故尊称为莫队算法

使用前提：

1、离线操作

2、若已知[l,r]内的答案，可以在O（1）时间内得到[l-1,r],[l+1,r],[l,r-1],[l,r+1]的答案，即可使用莫队算法，时间复杂度O（n^1.5）。

若可在O(logn)内移动区间，时间复杂度则为O（n^1.5*logn）

个人理解：

莫队算法本质是分块

通过左右指针的移动避免了重复状态的计算

就本题来说

，

sum表示区间内数i的出现次数

那么∑sum[i]=r-l+1

2*（r-l+1）!

分母= ----------- = （r-l）*（r-l+1）

2!*(r-l-1) !

可以O（1）解决

那么就差∑sum[i]²

本题满足离线操作，如果我们能证明∑sum[i]²可以O（1）或O（logn）求出来，就可以使用莫队算法

由此图可以看出，满足前提条件2

所以我们可以使用莫队算法

还有，如果先询问[1,n]，再问[1,1]，再问[n,n]，时间复杂度不还是n²吗

所以，为了避免指针在整个序列中移动，我们需要分块

因为分块保证了莫队算法的时间复杂度

如何分块？

令块的大小为根号n

先根据询问区间左端点所在块，从小到大排，这样就将整个操作序列划分为了根号n块

对于每个块内的询问，根据右端点从小到大排

然后我们从左到右顺序计算每个询问的答案

这样可以保证时间复杂度为O（n^1.5）

时间复杂度分析：

A.左端点

1.块内的，由于块的大小为根号n，所以同一块内左端点一次询问最多移动根号n，即n^0.5次，m次询问总移动O（n*n^0.5）=O(n^1.5)

2、不在同一块内的，以为块的大小为n^0.5，所以跨越一次最多加上O（n^0.5），最多能跨越(n^0.5)次，所以跨越块导致左端点最多加上O（n）

所以左端点总的移动次数为O（n^1.5）+O(n)

B.右端点

1、块内的，右端点最多从1移动到n，有根号n个块，所以右端点最多移动O（n^1.5）次

2、跨越块的，最多跨越个根号n次，每次跨越最多移动n次，所以右端点最多移动 O（n^1.5）

所以右端点总移动次数为O（n^1.5）+O(n^1.5)

所以时间复杂度为O（n^1.5）

#include<cstdio>
#include<algorithm>
#include<cmath>
using namespace std;
int col[50001];
struct node
{
    int l,r,id,pos;
    long long a,b;
}e[50001];
int n,m,S;
long long h,ans,sum[50001];
bool cmp(node p,node q)
{
    if(p.pos!=q.pos) return p.pos<q.pos; 
    return p.r<q.r;
}
bool id(node p,node q)
{
    return p.id<q.id;
}
void update(int x,int k)
{
    ans-=sum[col[x]]*sum[col[x]];
    sum[col[x]]+=k;
    ans+=sum[col[x]]*sum[col[x]];
}
long long gcd(long long a,long long b)
{
    return b==0 ? a:gcd(b,a%b);
}
void solve()
{
    int l=1,r=0;
    for(int i=1;i<=m;i++)
    {
        while(l<e[i].l) update(l++,-1);
        while(l>e[i].l) update(--l,1);
        while(r<e[i].r) update(++r,1);
        while(r>e[i].r) update(r--,-1);
        e[i].a=ans-(r-l+1);
        e[i].b=1ll*(r-l)*(r-l+1);
        h=gcd(e[i].a,e[i].b);
        e[i].a/=h;e[i].b/=h;
    }
}
int main()
{
    scanf("%d%d",&n,&m);
    S=sqrt(n);
    for(int i=1;i<=n;i++) scanf("%d",&col[i]);
    for(int i=1;i<=m;i++)
     {
        scanf("%d%d",&e[i].l,&e[i].r);
        e[i].id=i;
        e[i].pos=(e[i].l-1)/S+1;
    }
    sort(e+1,e+m+1,cmp);
    solve();
    sort(e+1,e+m+1,id);
    for(int i=1;i<=m;i++) printf("%lld/%lld
",e[i].a,e[i].b);
}

小细节：l最初从1开始，r从0开始

因为l最开始一定小于e[i].l,这种情况下先计算l，在自加

r最开始一定小于e[i].r,这种情况下先自加，再计算