【XSY2753】Lcm 分治 FWT FFT 容斥

题目描述

  给你(n,k),要你选一些互不相同的正整数,满足这些数的(lcm)(n),且这些数的和为(k)的倍数。

  求选择的方案数。对(232792561)取模。

  (nleq {10}^{18},kleq 20)(n)的全部质因子都(leq 100)

题解

解法一

  一个(leq {10}^{18})的数最多有(15)不同的质因子。

  记(w=15,m=2^w=32768)

  先看看这个模数有什么特点。

  (p=232792561=lcm(1,2,ldots,20)+1)

  这告诉我们可以对长度在(1ldots 20)的区间DFT。

  所以可以在所有用到模(k)的余数的地方DFT,然后对于每个余数做要做的事情。

  对于一个数,如果这个数的某个质因子的最高次幂( eq n)的这个质因子的最高次幂,这个质因子是没有用的。

  这样可以把一个数(x)表示成一个数对(g(x)=(i,j)),其中(i)是一个状态,表示(x)有哪些质因子的最高次幂和(n)的最高次幂相同。(j)表示这个数模(k)的余数。

  先暴力枚举所有(n)的因子((approx {10}^5)个),记(a_{i,j})表示有多少个数(x)对应的数对(g(x)=(i,j))

  现在对于每一个(i),计算只取这些数,和模(k)(j=0ldots k-1)的方案数(f_{i,j})

  记(F_i(x)=sum_{i=0}^{k-1}f_{i,j}x^j),那么有(F_i(x)=prod_{i=0}^{k-1}{(1+x^i)}^{a_{i,j}}mod x^k)。(当然你也可以用一些其他的方法计算,比如说每加一个数进去就维护一下)

  算出(F_i(x))之后做一遍DFT,这样各个(j)之间就互不影响了。在做完接下来的步骤后IDFT回来,然后取(j=0)的值就是答案了。

  剩下的步骤我们认为(k=1),即不考虑模(k)的余数。

  现在我们要取一些(i)出来,满足(i_1~or~i_2~or,cdots,or~i_m),把答案加上(f_{i_1}f_{i_2}cdots f_{i_m})

  令(g_{i,j}=egin{cases}f_i&j=i\0&j eq iend{cases}),那么我们要求的答案就是一个类似(g_1oplus g_2opluscdotsoplus g_m)的东西(实际上在DFT之前(g_{i,0})(+1)表示不选,DFT之后每一位都要(+1))。这里(oplus)是集合或卷积。

  直接做的复杂度是(O(w4^w)),太慢了。

  注意到(g_i)只有一项非零,所以可能有更快的做法。

  考虑分治,观察怎么把两个状态合并。

  合并的时候记左边的结果为

  (A_1),右边的结果为(A_2),那么合并之后的就是(A_1+A_2+A_1A_2)

  合并的两个数组是长这样的:

  整个数组是一个部分重复很多次。

![](https://images2018.cnblogs.com/blog/1097689/201803/1097689-20180319083442163-80799273.png)

  我们可以只储存&计算循环节部分,要用更长的部分的时候再扩展。

  另一种理解是:每个(g_{i,j})对答案的(s_l(jsubseteq l))都有贡献,这个贡献是乘上去的(因为是在FWT后对应位乘起来)。

  因为前面已经做过一次求幂了((F_i(x))),所以你也可以这几步先不做(求幂和乘法),在最后做一次求幂。这个就是下面的容斥做法。

  总时间复杂度是(O(k^22^w+kw2^w))

解法二

  一个容斥的做法。

  记(g_{i,j})为有多少个数满足:对于(i)中每个(1)的二进制位,这些位对应的质因子的次数要取到上限,剩下位的可以任意取,且这个数模(k)(j)

  (G_i(x)=sum_{j=0}^{k-1}{(1+x^j)}^{g_{i,j}})

  然后容斥一下,容斥过程就是IFWT。

  那么把这个东西做一遍IFWT就是答案了。

  时间复杂度和上面的差不多。

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
typedef long long ll;
const int p=232792561;
const int root=71;
ll fp(ll a,ll b)
{
	ll s=1;
	for(;b;b>>=1,a=a*a%p)
		if(b&1)
			s=s*a%p;
	return s;
}
int w[1010];
int w2[1010];
ll n;
int m,k,cnt;
ll a[200010];
int d[100];
int c[100];
ll e[100];
int all;
void dft(int *a,int n)
{
	static int b[100];
	for(int i=0;i<n;i++)
		b[i]=0;
	for(int i=0;i<n;i++)
		for(int j=0;j<n;j++)
			b[i]=(b[i]+(ll)a[j]*w[i*j])%p;
	for(int i=0;i<n;i++)
		a[i]=b[i];
}
void idft(int *a,int n)
{
	static int b[100];
	for(int i=0;i<n;i++)
		b[i]=0;
	for(int i=0;i<n;i++)
		for(int j=0;j<n;j++)
			b[i]=(b[i]+(ll)a[j]*w2[i*j])%p;
	int inv=fp(n,p-2);
	for(int i=0;i<n;i++)
		a[i]=(ll)b[i]*inv%p;
}
void getfactor(int x,ll s)
{
	if(x>m)
	{
		a[++cnt]=s;
		return;
	}
	for(int i=0;i<=d[x];i++,s*=c[x])
		getfactor(x+1,s);
}
int f[50000][20];
int g[50000][20];
void gao(int x,int y,int s)
{
	if(x==0)
	{
//		for(int i=0;i<k;i++)
//			f[y][i]=b[s][i];
//		dft(f[y],k);
//		idft(f[y],k);
		return;
	}
	gao(x-1,y,s);
	gao(x-1,y+(1<<(x-1)),s|(1<<(x-1)));
	for(int i=y+(1<<(x-1));i<y+(1<<x);i++)
		for(int j=0;j<k;j++)
		{
			g[i][j]=f[i][j];
			f[i][j]=f[i-(1<<(x-1))][j];
//			f[i][j]=1;
		}
	for(int i=y;i<y+(1<<(x-1));i++)
		for(int j=0;j<k;j++)
//			g[i][j]=1;
			g[i][j]=0;
	for(int i=y;i<y+(1<<x);i++)
		for(int j=0;j<k;j++)
			f[i][j]=(f[i][j]+g[i][j]+(ll)f[i][j]*g[i][j])%p;
}
void add(int x,int y)
{
	static int c[20];
	for(int i=0;i<k;i++)
		c[i]=f[x][i];
	for(int i=0;i<k;i++)
		f[x][(i+y)%k]=(f[x][(i+y)%k]+c[i])%p;
	f[x][y]=(f[x][y]+1)%p;
}
void solve()
{
	scanf("%lld%d",&n,&k);
	w[0]=1;
	ll rt=fp(root,(p-1)/k);
	for(int i=1;i<=1000;i++)
		w[i]=(ll)w[i-1]*rt%p;
	for(int i=0;i<=1000;i++)
		w2[i]=fp(w[i],p-2);
	m=0;
	for(int i=2;i<=100;i++)
		if(n%i==0)
		{
			m++;
			c[m]=i;
			d[m]=0;
			e[m]=1;
			while(n%i==0)
			{
				n/=i;
				d[m]++;
				e[m]*=i;
			}
		}
	cnt=0;
	getfactor(1,1);
	memset(f,0,sizeof f);
	for(int i=1;i<=cnt;i++)
	{
		int s=0;
		for(int j=1;j<=m;j++)
			if(a[i]%e[j]==0)
				s|=1<<(j-1);
		add(s,a[i]%k);
	}
	for(int i=0;i<1<<m;i++)
	{
		f[i][0]++;
		dft(f[i],k);
	}
//	gao(m,0,0);
	for(int i=1;i<1<<m;i<<=1)
		for(int j=0;j<1<<m;j++)
			if(j&i)
				for(int l=0;l<k;l++)
					f[j][l]=(ll)f[j][l]*f[j-i][l]%p;
//	for(int j=1;j<1<<m;j<<=1)
//		for(int l=0;l<1<<m;l++)
//			if(j&l)
//				for(int i=0;i<k;i++)
//					f[l][i]=(f[l][i]-f[l-j][i])%p;
	int all=(1<<m)-1;
	for(int i=0;i<all;i++)
	{
		int v=1;
		for(int j=0;j<m;j++)
			if(!((i>>j)&1))
				v=-v;
		for(int j=0;j<k;j++)
			f[all][j]=(f[all][j]+v*f[i][j])%p;
	}
	idft(f[all],k);
	ll ans=f[all][0];
	ans=(ans+p)%p;
	printf("%lld
",ans);
}
int main()
{
#ifndef ONLINE_JUDGE
	freopen("a.in","r",stdin);
	freopen("a.out","w",stdout);
#endif
	int t;
	scanf("%d",&t);
	while(t--)
		solve();
	return 0;
}
原文地址:https://www.cnblogs.com/ywwyww/p/8598902.html