【洛谷3396】哈希冲突（大力分块）

大致题意： 给你一个长度为(n)的数组(val)以及(m)个操作，操作有两种：一种是将(val_x)修改为(y)，另一种操作是求出(sum val_i(i\%x=y))。

朴素的暴力

我们先来写一个朴素的暴力，代码如下：

#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define abs(x) ((x)<0?-(x):(x))
#define LL long long
#define ull unsigned long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define Fsize 100000
#define tc() (FinNow==FinEnd&&(FinEnd=(FinNow=Fin)+fread(Fin,1,Fsize,stdin),FinNow==FinEnd)?EOF:*FinNow++)
#define pc(ch) (FoutSize<Fsize?Fout[FoutSize++]=ch:(fwrite(Fout,1,Fsize,stdout),Fout[(FoutSize=0)++]=ch))
#define N 150000
int FoutSize=0,OutputTop=0;char Fin[Fsize],*FinNow=Fin,*FinEnd=Fin,Fout[Fsize],OutputStack[Fsize];
using namespace std;
int n,Q,a[N+5];
inline void read(int &x)
{
    x=0;static char ch;
    while(!isdigit(ch=tc()));
    while(x=(x<<3)+(x<<1)+ch-48,isdigit(ch=tc()));
}
inline void read_alpha(char &x)
{
    while(!isalpha(x=tc()));
} 
inline void write(int x)
{
    if(!x) return (void)pc('0');
    while(x) OutputStack[++OutputTop]=x%10+48,x/=10;
    while(OutputTop) pc(OutputStack[OutputTop]),--OutputTop;
}
int main()
{
    register int i,x,y,ans;register char op;
    for(read(n),read(Q),i=1;i<=n;++i) read(a[i]);
    while(Q--)
    {
        read_alpha(op),read(x),read(y);
        if(op^'A') a[x]=y;//对于修改操作直接O(1)修改
        else
        {
            for(ans=0,i=y;i<=n;i+=x) ans+=a[i];//据题意统计答案
            write(ans),pc('
');//输出
        }
    }
    return fwrite(Fout,1,FoutSize,stdout),0;
}

我们可以惊喜地发现，这样就有(91)分了。~~如果你写得足够优秀，说不定可以直接AC。~~

预处理答案+暴力更新

我们可以用(ans_{i,j})来记录询问(i,j)时的答案。

首先，(O(n^2))预处理出答案，并用(O(n^2))大小的数组把答案存下来，对于询问，可以(O(1))输出答案，并(O(n))暴力更新。

然后，我们悲剧地发现(n≤150000)，还没等到(TLE)，直接内存炸飞了。。。

代码略。

如何优化

我们可以对第二个~~上天了的~~代码进行优化。

记录全部答案毕竟所耗内存太大了，能不能只记录一部分的答案，然后另一部分暴力算呢？

就可以考虑分块。

我们可以先(O(nsqrt n))暴力预处理模数(≤sqrt n)时的答案，并用(ans)数组将其存储下来。

然后，对于修改，我们可以在(O(sqrt n))的时间复杂度内枚举每一个小于等于(sqrt n)的模数，然后更新对应的(ans)。

对于询问，我们分两种情况讨论：

如果模数(≤O(sqrt n))，就直接输出(ans)。
如果模数(>O(sqrt n))，就暴力求解，且枚举的数的个数肯定小于(O(sqrt n))。

这样的算法应该是(O((n+m)sqrt n))的。

一个玄学的小优化

虽然我个人认为最优块的大小应该是(O(sqrt n))，但是，实践证明，以(O(sqrt[3] n))为块的大小要比(O(sqrt n))快很多。

代码

#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define abs(x) ((x)<0?-(x):(x))
#define LL long long
#define ull unsigned long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define Fsize 100000
#define tc() (FinNow==FinEnd&&(FinEnd=(FinNow=Fin)+fread(Fin,1,Fsize,stdin),FinNow==FinEnd)?EOF:*FinNow++)
#define pc(ch) (FoutSize<Fsize?Fout[FoutSize++]=ch:(fwrite(Fout,1,Fsize,stdout),Fout[(FoutSize=0)++]=ch))
#define N 150000
#define SIZE 400 
int FoutSize=0,OutputTop=0;char Fin[Fsize],*FinNow=Fin,*FinEnd=Fin,Fout[Fsize],OutputStack[Fsize];
using namespace std;
int n,Q,blo,a[N+5],ans[SIZE][SIZE];
inline void read(int &x)
{
    x=0;static char ch;
    while(!isdigit(ch=tc()));
    while(x=(x<<3)+(x<<1)+ch-48,isdigit(ch=tc()));
}
inline void read_alpha(char &x)
{
    while(!isalpha(x=tc()));
} 
inline void write(int x)
{
    if(!x) return (void)pc('0');
    while(x) OutputStack[++OutputTop]=x%10+48,x/=10;
    while(OutputTop) pc(OutputStack[OutputTop]),--OutputTop;
}
int main()
{
    register int i,j,x,y,res;register char op;
    for(read(n),read(Q),blo=pow(n,0.33333),i=1;i<=n;++i) read(a[i]);//读入数据，这里的块的大小取n^(1/3)要比n^(1/2)快很多
    for(i=1;i<=n;++i) for(j=1;j<=blo;++j) ans[j][i%j]+=a[i];//O(n^(4/3))暴力预处理出模数≤n^(1/3)时的答案
    while(Q--)
    {
        read_alpha(op),read(x),read(y);
        if(op^'A')//对于修改操作
        {
            for(i=1;i<=blo;++i)//枚举每一个小于等于n^(1/3)的模数，修改对应答案
                ans[i][x%i]+=y-a[x];//减去原来的值，加上更新之后的值
            a[x]=y;//修改
        }
        else//对于询问操作
        {
            if(x<=blo) {write(ans[x][y]),pc('
');continue;}//如果模数≤n^(1/3)，直接输出预处理得到的答案
            for(i=y,res=0;i<=n;i+=x) res+=a[i];//否则，暴力统计答案
            write(res),pc('
');//输出答案
        }
    }
    return fwrite(Fout,1,FoutSize,stdout),0;
}