【XSY2612】Comb Avoiding Trees 生成函数 多项式求逆 矩阵快速幂

题目大意

  本题的满二叉树定义为:不存在只有一个儿子的节点的二叉树。

  定义一棵满二叉树(A)包含满二叉树(B)当且经当(A)可以通过下列三种操作变成(B)

  • 把一个节点的两个儿子同时删掉
  • 把一棵子树替换成根的的左子树或右子树。

  定义(k)连树为一棵只有恰好(k)个叶子的满二叉树,如果某个节点有一个右孩子,那么这个右孩子一定是一个叶子。

  对于给定的(k)(n),对于所有在(1)(n)之间的(i),你需要求出所有叶子节点恰好为(i),且不包含(k)连树的满二叉树个数。因为答案很大,请对(998244353)取模。

  (n,kleq 130000)

题解

  设(f_{i,j})(i)个叶子不包含(j)连树的方案数。

  如果根的左儿子包含(i)连树那么这棵树就会包含(i+1)连树。

  如果根的右儿子包含(i)连树那么这棵树就会包含(i)连树。

  所以有:

[f_{i,j}=sum_{k=1}^{i-1}f_{k,j-1}f_{i-k,j} ]

  这是一个(O(n^2k))的DP。

  观察到上面这个东西是个卷积,看看生成函数有没有什么性质:

  设(F_j(x)=sum_{i=0}^infty f_{i,j}x^i)

[egin{align} F_j(x)&=F_{j-1}(x)F_j(x)+x\ F_j(x)&=frac{x}{1-F_{j-1}(x)} end{align} ]

  如果直接多项式求逆是(O(knlog n))的,很明显会TLE。

  设(F_j(x)=frac{A_j(x)}{B_j(x)})

[egin{align} F_j(x)&=frac{x}{1-frac{A_{j-1}(x)}{B_{j-1}(x)}}\ &=frac{xB_{j-1}(x)}{B_{j-1}(x)-A_{j-1}(x)}\ A_j(x)&=xB_{j-1}(x)\ B_j(x)&=B_{j-1}(x)-A_{j-1}(x) end{align} ]

[left[egin{matrix} A_j(x)&B_j(x) end{matrix} ight] = left[egin{matrix} A_{j-1}(x)&B_{j-1}(x) end{matrix} ight] left[egin{matrix} 0&-1\ x&1 end{matrix} ight] ]

  那么这就是个常系数线性递推。易证(A_k(x),B_k(x))的次数不超过(lfloorfrac{k}{2} floor),所以可以暴力矩乘+FFT做到(O(k^2log k)),也可以把(O(k))个单位根带进去做一波矩阵快速幂然后用IDFT插回来。

  最后直接求出(A_k(x){B_k(x)}^{-1})(1)(n)项就可以了。

  时间复杂度:(O(nlog n+klog k))

  zjt:其实可以做到(O(klog klog n))求一项的。详见zjt大佬的博客

代码

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cstdlib>
#include<ctime>
#include<utility>
#include<cmath>
#include<functional>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int,int> pii;
typedef pair<ll,ll> pll;
void sort(int &a,int &b)
{
	if(a>b)
		swap(a,b);
}
void open(const char *s)
{
#ifndef ONLINE_JUDGE
	char str[100];
	sprintf(str,"%s.in",s);
	freopen(str,"r",stdin);
	sprintf(str,"%s.out",s);
	freopen(str,"w",stdout);
#endif
}
const ll p=998244353;
const ll g=3;
ll fp(ll a,ll b)
{
	ll s=1;
	while(b)
	{
		if(b&1)
			s=s*a%p;
		a=a*a%p;
		b>>=1;
	}
	return s;
}
namespace orzzjt
{
	struct mat
	{
		ll a[2][2];
		mat()
		{
			memset(a,0,sizeof a);
		}
		ll *operator [](int x)
		{
			return a[x];
		}
	};
	mat operator *(mat a,mat b)
	{
		mat c;
		c[0][0]=(a[0][0]*b[0][0]+a[0][1]*b[1][0])%p;
		c[0][1]=(a[0][0]*b[0][1]+a[0][1]*b[1][1])%p;
		c[1][0]=(a[1][0]*b[0][0]+a[1][1]*b[1][0])%p;
		c[1][1]=(a[1][0]*b[0][1]+a[1][1]*b[1][1])%p;
		return c;
	}
	mat pow(mat a,int n)
	{
		mat s;
		s[0][0]=s[1][1]=1;
		while(n)
		{
			if(n&1)
				s=s*a;
			a=a*a;
			n>>=1;
		}
		return s;
	}
	mat a,b;
	pll calc(ll x,int n)
	{
		a[0][0]=0;
		a[0][1]=-1;
		a[1][0]=x;
		a[1][1]=1;
		b[0][0]=0;
		b[0][1]=1;
		b[1][0]=0;
		b[1][1]=0;
		a=pow(a,n-1);
		b=b*a;
		return pll(b[0][0],b[0][1]);
	}
};
namespace ntt
{
	ll w1[270010];
	ll w2[270010];
	int rev[270010];
	int n;
	void init(int m)
	{
		n=m;
		int i;
		for(i=2;i<=n;i<<=1)
		{
			w1[i]=fp(g,(p-1)/i);
			w2[i]=fp(w1[i],p-2);
		}
		rev[0]=0;
		for(i=1;i<n;i++)
			rev[i]=(rev[i>>1]>>1)|(i&1?n>>1:0);
	}
	void ntt(ll *a,int t)
	{
		ll u,v,w,wn;
		int i,j,k;
		for(i=0;i<n;i++)
			if(rev[i]<i)
				swap(a[i],a[rev[i]]);
		for(i=2;i<=n;i<<=1)
		{
			wn=(t==1?w1[i]:w2[i]);
			for(j=0;j<n;j+=i)
			{
				w=1;
				for(k=j;k<j+i/2;k++)
				{
					u=a[k];
					v=a[k+i/2]*w%p;
					a[k]=(u+v)%p;
					a[k+i/2]=(u-v)%p;
					w=w*wn%p;
				}
			}
		}
		if(t==-1)
		{
			ll inv=fp(n,p-2);
			for(i=0;i<n;i++)
				a[i]=a[i]*inv%p;
		}
	}
	ll x[270010];
	ll y[270010];
	void copy_clear(ll *a,ll *b,int m)
	{
		int i;
		for(i=0;i<m;i++)
			a[i]=b[i];
		for(i=m;i<n;i++)
			a[i]=0;
	}
	void copy(ll *a,ll *b,int m)
	{
		int i;
		for(i=0;i<m;i++)
			a[i]=b[i];
	}
	void inverse(ll *a,ll *b,int m)
	{
		if(m==1)
		{
			b[0]=fp(a[0],p-2);
			return;
		}
		inverse(a,b,m>>1);
		init(2*m);
		copy_clear(x,a,m);
		copy_clear(y,b,m>>1);
		ntt(x,1);
		ntt(y,1);
		int i;
		for(i=0;i<n;i++)
			x[i]=(2*y[i]%p-x[i]*y[i]%p*y[i]%p+p)%p;
		ntt(x,-1);
		copy(b,x,m);
	}
};
ll w[270010];
ll a[270010];
ll b[270010];
ll c[270010];
int main()
{
	open("b");
	int m,n;
	scanf("%d%d",&m,&n);
	int i;
	int k=1;
	while(k<=(m>>1)+1)
		k<<=1;
	w[0]=1;
	w[1]=fp(g,(p-1)/k);
	for(i=2;i<k;i++)
		w[i]=w[i-1]*w[1]%p;
	ntt::init(k);
	for(i=0;i<k;i++)
	{
		pll s=orzzjt::calc(w[i],m);
		a[i]=s.first;
		b[i]=s.second;
	}
	ntt::ntt(a,-1);
	ntt::ntt(b,-1);
	while(k<=n)
		k<<=1;
	ntt::inverse(b,c,k);
	ntt::init(2*k);
	ntt::ntt(a,1);
	ntt::ntt(c,1);
	for(i=0;i<2*k;i++)
		a[i]=a[i]*c[i]%p;
	ntt::ntt(a,-1);
	for(i=1;i<=n;i++)
	{
		a[i]=(a[i]%p+p)%p;
		printf("%lld
",a[i]);
	}
	return 0;
}
原文地址:https://www.cnblogs.com/ywwyww/p/8513224.html