loj#6485. LJJ 学二项式定理(单位根反演)

题面

传送门

题解

首先你要知道一个叫做单位根反演的东西

[{1over k}sum_{i=0}^{k-1}omega^{in}_k=[k|n] ]

直接用等比数列求和就可以证明了

而且在模(998244353)意义下的(omega_k^1=g^{P-1over k})

据说这玩意儿在(NTT)的证明里有?然而我那时候光顾着背板子了

所以这个单位根反演简称小单的玩意儿能干嘛呢

然后我们惊奇的发现小单可以让我们快速求一个数列里某个数倍数项的和

[egin{aligned} sum_{i=1}^n a_i[k|i] &={1over k}sum_{i=1}^na_isum_{j=0}^{k-1}{omega_k^{ji}}\ &={1over k}sum_{j=0}^{k-1}sum_{i=1}^na_i{omega_k^{ji}}\ &={1over k}sum_{j=0}^{k-1}f(omega_k^j) end{aligned} ]

其中(f)表示(a_i)的生成函数,上面那个意思是把(omega_k^j)代入这个生成函数中的(x)

那么复杂度就能从(n)倾向于(k)

我们回到题目中来,首先肯定是要把模(4)同余的数分别求和再乘上(a_i)

考虑要求和的式子,是(sum_{i=0}^n {nchoose i}S^i=sum_{i=0}^n {nchoose i}S^{n-i})

把它化成形式幂级数的形式,是(sum_{i=0}^n{nchoose i}S^{n-i}x^i=(x+S)^n)

很好,对于如果把这个式子记成(f(x)),那么我们就能用快速幂(O(log n))算出所有是(4)的倍数的项的和了

然而这里不是只有(4)的倍数的项啊?还需要算模(4)(1,2,3)的项的和啊?

这也没问题,我们考虑把这个多项式平移,比方说多项式乘个(x),那么原来模(4)(1)的项就变成了模(4)(2)。以此类推,我们就能求出模(4)(1,2,3)的和了

综上

[egin{aligned} ans &=sum_{k=0}^3a_ksum_{j=0}^{n}{nchoose i}S^i[iequiv k mod 4]\ &=sum_{k=0}^3a_ksum_{j=0}^{n}{nchoose i}S^{n-i}[n-iequiv k mod 4]\ &=sum_{k=0}^3a_{n-kmod 4}sum_{j=0}^{n}{nchoose i}S^{n-i}[iequiv k mod 4]\ &={1over 4}sum_{k=0}^3a_{n-kmod 4}sum_{j=0}^{3}{f(omega_4^j)over omega_4^{jk}}\ end{aligned} ]

然后没有然后了

//minamoto
#include<bits/stdc++.h>
#define R register
#define ll long long
#define fp(i,a,b) for(R int i=a,I=b+1;i<I;++i)
#define fd(i,a,b) for(R int i=a,I=b-1;i>I;--i)
#define go(u) for(int i=head[u],v=e[i].v;i;i=e[i].nx,v=e[i].v)
using namespace std;
char buf[1<<21],*p1=buf,*p2=buf;
inline char getc(){return p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++;}
ll read(){
    R ll res,f=1;R char ch;
    while((ch=getc())>'9'||ch<'0')(ch=='-')&&(f=-1);
    for(res=ch-'0';(ch=getc())>='0'&&ch<='9';res=res*10+ch-'0');
    return res*f;
}
char sr[1<<21],z[20];int C=-1,Z=0;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
void print(R int x){
    if(C>1<<20)Ot();if(x<0)sr[++C]='-',x=-x;
    while(z[++Z]=x%10+48,x/=10);
    while(sr[++C]=z[Z],--Z);sr[++C]='
';
}
const int P=998244353;
inline int add(R int x,R int y){return x+y>=P?x+y-P:x+y;}
inline int mul(R int x,R int y){return 1ll*x*y-1ll*x*y/P*P;}
int ksm(R int x,R ll y){
	R int res=1;
	for(;y;y>>=1,x=mul(x,x))if(y&1)res=mul(res,x);
	return res;
}
const int w[4]={1,911660635,998244352,86583718};
const int invw[4]={1,86583718,998244352,911660635};
ll n,now,a[4];int s,res,f[4];
int main(){
//	freopen("testdata.in","r",stdin);
	for(int T=read();T;--T){
		n=read(),s=read(),a[0]=read()%P,a[1]=read()%P,a[2]=read()%P,a[3]=read()%P;
		fp(i,0,3)f[i]=ksm((w[i]+s)%P,n);
		res=0;
		fp(i,0,3){
			now=0;fp(j,0,3)now+=f[j];
			fp(j,0,3)f[j]=mul(f[j],invw[j]);
			res=add(res,now*a[(n-i+4)%4]%P);
		}
		print(mul(res,748683265));
	}
	return Ot(),0;
}
原文地址:https://www.cnblogs.com/bztMinamoto/p/10474486.html