分治FFT
概述
严格的分治FFT为“一般形式”,而我们把所有带有FFT的分治都称为分治FFT,所以这个名称并没有什么意义。
分治FFT代码比较复杂,低阶的比赛里应该不会出现。
一般形式
严格的分治FFT负责解决类似(displaystyle b_k=sum^{k-1}_{i=1}{b_ia_{k-i}})的数列,其中整个式子的形状符合卷积,且所求数列的每一项都依赖于前面的项。
已知数组(a),求数组(b),其中(displaystyle b_k=sum^{k-1}_{i=1}{b_ia_{k-i}})
考虑分治,对于区间([l,r)),先计算([l,m))的答案。对于(kgeq m),将(b_k)拆成(displaystyle sum^{m-1}_{i=0}b_ia_{k-i})和(displaystyle sum^{k-1}_{i=m}b_ia_{k-i})两部分,后者可以给数组下标添加偏移量之后递归计算,而前者可以通过普通的卷积计算。
总时间复杂度为(Theta(n log^2 n))。
实现
假设我们求出了(l o mid)的答案,要求这些点对(mid+1 o r)的影响,那么对右半边点(x)的贡献为:(displaystyle w_x=sum_{i=l}^{mid} f[i] * g[x-i])这部分可以利用卷积来快速计算。计算完以后,答案直接加到答案数组就可以了。需要注意的是,如果要求左边点对右边点的影响,首先整个区间以左对该区间的贡献应该先求出。所以分治过程为先分治左边,在求出中间,然后在递归右边。
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN=1e6+10;
const LL MOD=998244353,G=3,iG=332748118;
inline LL fpm(LL base,LL p){
LL ret=1;
while(p){
if(p&1)
ret=ret*base%MOD;
base=base*base%MOD;
p>>=1;
}
return ret;
}
void exgcd(LL a,LL b,LL &x,LL &y){
if(!b){
x=1;
y=0;
return;
}
exgcd(b,a%b,y,x);
y-=x*(a/b);
}
inline LL inv(LL x){
LL ii,jj;
exgcd(x,MOD,ii,jj);
return (ii%MOD+MOD)%MOD;
}
int lim,rev[MAXN],N,L;
inline void prec(int l,int r){
lim=1;
L=0;
while(lim<r-l){
L++;
lim<<=1;
}
for(int i=0;i<lim;i++)
rev[i]=rev[i>>1]>>1|(i&1)<<(L-1);
}
inline void NTT(LL *a,int type){
for(int i=0;i<lim;i++)
if(i<rev[i])
swap(a[i],a[rev[i]]);
for(int hf=1;hf<lim;hf<<=1){
int len=hf<<1;
LL Wn=fpm(type==1?G:iG,(MOD-1)/len);
for(int j=0;j<lim;j+=len){
LL w=1;
for(int k=0;k<hf;k++){
LL t1=a[j+k],t2=a[j+k+hf]*w%MOD;
a[j+k]=(t1+t2)%MOD;
a[j+k+hf]=(t1-t2)%MOD;
w=w*Wn%MOD;
}
}
}
}
LL f[MAXN],g[MAXN],A[MAXN],B[MAXN];
inline void cdq(int l,int r){
if(l+1>=r||l>=N)
return;
int mid=(l+r)>>1;
cdq(l,mid);
prec(l,r);
memcpy(A,f+l,((r-l)/2)<<3);
memcpy(B,g,(r-l)<<3);
memset(A+(r-l)/2,0,((r-l)/2)<<3);
NTT(A,1);
NTT(B,1);
for(int i=0;i<r-l;i++)
A[i]=A[i]*B[i]%MOD;
NTT(A,-1);
int ii=inv(r-l);
for(int i=0;i<r-l;i++)
A[i]=A[i]*ii%MOD;
for(int i=(r-l)>>1;i<r-l;i++)
f[i+l]=(f[i+l]+A[i])%MOD;
cdq(mid,r);
}
int main(){
scanf("%d",&N);
for(int i=1;i<N;i++)
scanf("%lld",g+i);
prec(0,N);
f[0]=1;
cdq(0,lim);
for(int i=0;i<N;i++)
printf("%lld ",(f[i]+MOD)%MOD);
return 0;
}
例题
P4721 【模板】分治 FFT
见“实现”
#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int MAXN=1e6+10;
const LL MOD=998244353,G=3,iG=332748118;
inline LL fpm(LL base,LL p){
LL ret=1;
while(p){
if(p&1)
ret=ret*base%MOD;
base=base*base%MOD;
p>>=1;
}
return ret;
}
void exgcd(LL a,LL b,LL &x,LL &y){
if(!b){
x=1;
y=0;
return;
}
exgcd(b,a%b,y,x);
y-=x*(a/b);
}
inline LL inv(LL x){
LL ii,jj;
exgcd(x,MOD,ii,jj);
return (ii%MOD+MOD)%MOD;
}
int lim,rev[MAXN],N,L;
inline void prec(int l,int r){
lim=1;
L=0;
while(lim<r-l){
L++;
lim<<=1;
}
for(int i=0;i<lim;i++)
rev[i]=rev[i>>1]>>1|(i&1)<<(L-1);
}
inline void NTT(LL *a,int type){
for(int i=0;i<lim;i++)
if(i<rev[i])
swap(a[i],a[rev[i]]);
for(int hf=1;hf<lim;hf<<=1){
int len=hf<<1;
LL Wn=fpm(type==1?G:iG,(MOD-1)/len);
for(int j=0;j<lim;j+=len){
LL w=1;
for(int k=0;k<hf;k++){
LL t1=a[j+k],t2=a[j+k+hf]*w%MOD;
a[j+k]=(t1+t2)%MOD;
a[j+k+hf]=(t1-t2)%MOD;
w=w*Wn%MOD;
}
}
}
}
LL f[MAXN],g[MAXN],A[MAXN],B[MAXN];
inline void cdq(int l,int r){
if(l+1>=r||l>=N)
return;
int mid=(l+r)>>1;
cdq(l,mid);
prec(l,r);
memcpy(A,f+l,((r-l)/2)<<3);
memcpy(B,g,(r-l)<<3);
memset(A+(r-l)/2,0,((r-l)/2)<<3);
NTT(A,1);
NTT(B,1);
for(int i=0;i<r-l;i++)
A[i]=A[i]*B[i]%MOD;
NTT(A,-1);
int ii=inv(r-l);
for(int i=0;i<r-l;i++)
A[i]=A[i]*ii%MOD;
for(int i=(r-l)>>1;i<r-l;i++)
f[i+l]=(f[i+l]+A[i])%MOD;
cdq(mid,r);
}
int main(){
scanf("%d",&N);
for(int i=1;i<N;i++)
scanf("%lld",g+i);
prec(0,N);
f[0]=1;
cdq(0,lim);
for(int i=0;i<N;i++)
printf("%lld ",(f[i]+MOD)%MOD);
return 0;
}