【洛谷P4191】【CTSC2010】—性能优化(混合基FFT)

传送门


具体看这篇博客就差不多了
注意迭代时先预处理一下位置
中间过程手推一下吧

#include<bits/stdc++.h>
using namespace std;
#define ll long long
#define pb push_back
const int RLEN=1<<20|1;
inline char gc(){
    static char ibuf[RLEN],*ib,*ob;
    (ob==ib)&&(ob=(ib=ibuf)+fread(ibuf,1,RLEN,stdin));
    return (ob==ib)?EOF:*ib++;
}
#define gc getchar
inline int read(){
    char ch=gc();
    int res=0,f=1;
    while(!isdigit(ch))f^=ch=='-',ch=gc();
    while(isdigit(ch))res=(res+(res<<2)<<1)+(ch^48),ch=gc();
    return f?res:-res;
}
const int N=500005;
int n,c,g,mod;
inline int add(int a,int b){
    return a+b>=mod?a+b-mod:a+b;
}
inline void Add(int &a,int b){
    a=add(a,b);
}
inline int dec(int a,int b){
    return a>=b?a-b:a-b+mod;
}
inline void Dec(int &a,int b){
    a=dec(a,b);
}
inline int mul(int a,int b){
    return 1ll*a*b>=mod?1ll*a*b%mod:a*b;
}
inline void Mul(int &a,int b){
    a=mul(a,b);
}
inline int ksm(int a,int b,int res=1){
    for(;b;b>>=1,a=mul(a,a))(b&1)?(res=mul(res,a)):0;return res;
}
int pr[N],tot,A[N],B[N],w[N],pos[N];
inline bool check(int x){
    for(int i=1;i<=tot;i++)if(ksm(x,n/pr[i])==1)return false;
    return true;
}
inline void findG(int phi){
    for(int i=2;i<=10;i++){
        for(;!(phi%i);pr[++tot]=i,phi/=i);
    }
    g=2;
    while(!check(g))g++;
}
inline int findpos(int i,int plc,int pos,int len){
    if(pos==0)return plc;
    int a=len/pr[pos],b=i%pr[pos];
    return findpos((i-b)/pr[pos],plc+a*b,pos-1,a);
}
inline void dft(int *a,int lim,int kd){
    static int f[N];
    memcpy(f,a,sizeof(int)*lim);
    for(int i=0;i<lim;i++)f[pos[i]]=a[i];
    memcpy(a,f,sizeof(int)*lim);
    for(int bl=1,pos=1;pos<=tot;bl*=pr[pos],pos++){
        int mid=bl*pr[pos],fg=n/mid;
        for(int i=0;i<lim;i+=mid)
            for(int j=0;j<mid;j+=bl)
                for(int k=0;k<bl;k++){
                    int s=0,p=(k+j)*fg;
                    for(int t=0;t<pr[pos];t++)
                        Add(s,mul(w[1ll*p*t%lim],a[i+k+bl*t]));
                    f[i+j+k]=s;
                }
        memcpy(a,f,sizeof(int)*lim);
    }
    if(kd==-1)for(int i=0,inv=ksm(lim,mod-2);i<lim;i++)Mul(a[i],inv);
}
int main(){
    n=read(),c=read(),mod=n+1,findG(n),c=(c-1)%n+1;
    for(int i=0;i<n;i++)A[i]=read();
    for(int i=0;i<n;i++)B[i]=read();
    w[0]=1;for(int i=1;i<n;i++)w[i]=mul(w[i-1],g);
    for(int i=1;i<n;i++)pos[i]=findpos(i,0,tot,n);
    dft(A,n,1),dft(B,n,1);
    for(int i=0;i<n;i++)Mul(A[i],ksm(B[i],c));
    dft(A,n,-1),reverse(A+1,A+n);
    for(int i=0;i<n;i++)cout<<A[i]<<'
';
}
原文地址:https://www.cnblogs.com/stargazer-cyk/p/11145538.html