多项式模板

这里给出了一个多项式/形式幂级数的类的实现。由于仅考虑形式幂级数的前n项，即$!mod{x^n}$下的等价类，故其形式与多项式相同，因而在类的实现上没有对两者作区分。没有返回值的方法会将结果用于更新自身。对于所有用于形式幂级数的方法，参数n代表$!mod{x^n}$，且保证调用后前n项均可访问。三角函数使用了要求$sqrt{-1}$存在的实现。下表说明了各方法的复杂度。

der(求导)/pri(积分)：$O(n)$
mul/inv/sqrt/log/exp/sin/cos/tan：$O(nlog n)$
div/mod：$O(nlog n)$
在$m$个点处求值：$O(nlog n+mlog^2min(m,n))$
以根集构造：$O(nlog^2n)$
以点集构造（插值）：$O(nlog^2n)$

注意，对于某些算式，相比直接调用以上方法进行计算，使用针对性的实现能使效率大幅提高。

#include<algorithm>
#include<vector>
#define RAN(a)a.begin(),a.end()
using namespace std;
typedef unsigned long long u64;
typedef unsigned u32;
namespace num{
	const u32 p=998244353;
	const u32 g=3;
	inline u32 imod(u32 a){
		return a<p?a:a-p;
	}
	inline u32 ipow(u32 a,u32 n){
		u32 s=1;
		for(;n;n>>=1){
			if(n&1)
				s=(u64)s*a%p;
			a=(u64)a*a%p;
		}
		return s;
	}
	class inv_t{
	public:
		inv_t():f(1,1){}
		u32 operator[](int n){
			int m=f.size();
			if(m<n){
				f.resize(n);
				for(int i=m+1;i<=n;++i)
					f[i-1]=(u64)(p-p/i)*f[p%i-1]%p;
			}
			return f[n-1];
		}
		u32 operator()(u32 a)const{
			return ipow(a,p-2);
		}
	private:
		vector<u32>f;
	}inv;
}
using namespace num;
class poly{
public:
	vector<u32>a;
	poly(){}
	explicit poly(int n):a(n){}
	u32&operator[](int i){
		return a[i];
	}
	const u32&operator[](int i)const{
		return a[i];
	}
	int size()const{
		return a.size();
	}
	void swap(poly&b){
		a.swap(b.a);
	}
	void der(){
		fix();
		if(size()){
			for(int i=1;i<size();++i)
				a[i-1]=(u64)i*a[i]%p;
			a.pop_back();
		}
	}
	void pri(){
		fix();
		shl();
		for(int i=size()-1;i>0;--i)
			a[i]=(u64)a[i]*num::inv[i]%p;
	}
	static int len(int n){
		while(n^n&-n)
			n+=n&-n;
		return n;
	}
	void fft(int n,bool f){
		a.resize(n);
		if(n<=1)
			return;
		for(int i=0,j=0;i<n;++i){
			if(i<j)
				std::swap(a[i],a[j]);
			int k=n>>1;
			while((j^=k)<k)
				k>>=1;
		}
		vector<u32>w(n/2);
		w[0]=1;
		for(int i=1;i<n;i<<=1){
			for(int j=i/2-1;~j;--j)
				w[j<<1]=w[j];
			int m=(p-1)/i/2;
			u64 s=ipow(g,f?p-1-m:m);
			for(int j=1;j<i;j+=2)
				w[j]=s*w[j-1]%p;
			for(int j=0;j<n;j+=i<<1){
				u32*b=&a[0]+j,*c=b+i;
				for(int k=0;k<i;++k){
					u32 v=(u64)w[k]*c[k]%p;
					c[k]=imod(b[k]+p-v);
					b[k]=imod(b[k]+v);
				}
			}
		}
	}
	void dft(int n){
		fft(n,0);
	}
	void idft(){
		int n=size();
		fft(n,1);
		u64 f=num::inv(n);
		for(int i=0;i<n;++i)
			a[i]=f*a[i]%p;
	}
	void fix(){
		while(size()&&!a.back())
			a.pop_back();
	}
	void mul(poly b){
		fix();
		b.fix();
		int n=len(size()+b.size()-1);
		dft(n);
		b.dft(n);
		for(int i=0;i<n;++i)
			a[i]=(u64)a[i]*b[i]%p;
		idft();
		fix();
	}
	void mod(int n){
		a.resize(n);
	}
	void inv(int n){
		int m=len(n);
		mod(m);
		vector<u32>b(1,num::inv(a[0]));
		a.swap(b);
		for(int i=2;i<=m;i<<=1){
			int l=i<<1;
			poly c(l);
			for(int j=0;j<i;++j)
				c[j]=b[j];
			c.dft(l);
			dft(l);
			for(int j=0;j<l;++j)
				a[j]=a[j]*(2+p-(u64)a[j]*c[j]%p)%p;
			idft();
			mod(i);
		}
		mod(n);
	}
	void sqrt(int n){
		int m=len(n);
		mod(m);
		vector<u32>b(1,1);
		a.swap(b);
		u64 w=(p+1)/2;
		for(int i=2;i<=m;i<<=1){
			poly c(i);
			for(int j=0;j<i;++j)
				c[j]=b[j];
			vector<u32>t=a;
			inv(i);
			mul(c);
			mod(i);
			for(int j=0;j<i>>1;++j)
				a[j]=w*(a[j]+t[j])%p;
			for(int j=i>>1;j<i;++j)
				a[j]=w*a[j]%p;
		}
		mod(n);
	}
	void log(int n){
		mod(n);
		poly b=*this;
		der();
		b.inv(n-1);
		mul(b);
		mod(n-1);
		pri();
		mod(n);
	}
	void exp(int n){
		int m=len(n);
		mod(m);
		vector<u32>b(1,1);
		a.swap(b);
		for(int i=2;i<=m;i<<=1){
			poly c=*this;
			log(i);
			for(int j=0;j<i;++j)
				a[j]=imod(b[j]+p-a[j]);
			++a[0]%=p;
			mul(c);
			mod(i);
		}
		mod(n);
	}
	void sin(int n){
		mod(n);
		u64 w=ipow(g,(p-1)/4);
		for(int i=0;i<n;++i)
			a[i]=a[i]*w%p;
		exp(n);
		poly b=*this;
		b.inv(n);
		w=(p+1)/2*(p-w)%p;
		for(int i=0;i<n;++i)
			a[i]=(a[i]+p-b[i])*w%p;
	}
	void cos(int n){
		mod(n);
		u64 w=ipow(g,(p-1)/4);
		for(int i=0;i<n;++i)
			a[i]=a[i]*w%p;
		exp(n);
		poly b=*this;
		b.inv(n);
		w=(p+1)/2;
		for(int i=0;i<n;++i)
			a[i]=(a[i]+b[i])*w%p;
	}
	void tan(int n){
		mod(n);
		u64 w=ipow(g,(p-1)/4)*2;
		for(int i=0;i<n;++i)
			a[i]=a[i]*w%p;
		exp(n);
		++a[0]%=p;
		inv(n);
		for(int i=0;i<n;++i)
			a[i]=a[i]*w%p;
		(a[0]+=p-w/2)%=p;
	}
	poly mod_bf(poly b){
		fix();
		b.fix();
		int n=size();
		int m=b.size();
		if(n<m)
			return poly();
		poly q(n-m+1);
		u64 w=num::inv(b[m-1]);
		for(;n>=m;--n)
			if(u64 s=a[n-1]*w%p){
				q[n-m]=s;
				for(int i=n-1;i>=n-m;--i)
					a[i]=(a[i]+(p-s)*b[i-n+m])%p;
			}
		fix();
		return q;
	}
	void gcd(poly b){
		fix();
		b.fix();
		while(b.size()){
			mod_bf(b);
			swap(b);
		}
	}
	void div(poly b){
		fix();
		b.fix();
		int n=size()-b.size()+1;
		if(n<=0){
			a.clear();
			return;
		}
		reverse(RAN(a));
		mod(n);
		reverse(RAN(b.a));
		b.inv(n);
		mul(b);
		mod(n);
		reverse(RAN(a));
		fix();
	}
	void mod(poly b){
		fix();
		b.fix();
		int m=b.size();
		if(size()>=m){
			poly c=*this;
			div(b);
			mul(b);
			mod(m-1);
			for(int i=0;i<m-1;++i)
				a[i]=imod(c[i]+p-a[i]);
			fix();
		}
	}
	u32 val(u32 x)const{
		u32 s=0;
		for(int i=size()-1;~i;--i)
			s=((u64)s*x+a[i])%p;
		return s;
	}
	u32 operator()(u32 x)const{
		return val(x);
	}
	template<class ite1,class ite2>
	void val(int n,ite1 x,ite2 y)const;
	template<class ite>
	poly(int n,ite x);
	template<class ite1,class ite2>
	poly(int n,ite1 x,ite2 y);
	class seg;
private:
	void shl(){
		a.insert(a.begin(),0);
	}
	void mod(poly b,const poly&f);
	template<class ite>
	static poly gen(int n,ite a);
	template<class ite>
	static poly gen(int x,int y,ite&a);
	template<class ite>
	static poly gen_bf(int n,ite&a);
};
void poly::mod(poly b,const poly&f){
	fix();
	b.fix();
	int m=b.size();
	if(size()>=m){
		poly c=*this;
		div(b);
		dft(f.size());
		for(int i=0;i<f.size();++i)
			a[i]=(u64)a[i]*f[i]%p;
		idft();
		for(int i=0;i<m-1;++i)
			a[i]=imod(c[i]+p-a[i]);
		mod(m-1);
		fix();
	}
}
template<class ite>
poly::poly(int n,ite x){
	*this=gen(n,x);
}
template<class ite>
poly poly::gen(int n,ite a){
	return gen(0,n,a);
}
template<class ite>
poly poly::gen(int x,int y,ite&a){
	if(y-x<=200){
		return gen_bf(y-x,a);
	}else{
		int m=x+y>>1;
		poly b=gen(x,m,a);
		b.mul(gen(m,y,a));
		return b;
	}
}
template<class ite>
poly poly::gen_bf(int n,ite&a){
	poly f(1);
	f[0]=1;
	for(int i=0;i<n;++i){
		f.shl();
		u64 s=p-*a++;
		for(int j=0;j<=i;++j)
			f[j]=(f[j]+s*f[j+1])%p;
	}
	return f;
}
class poly::seg{
public:
	template<class ite>
	seg(int n,const ite&x):a(n){
		ite t=x;
		for(int i=0;i<n;++i)
			a[i]=*t++;
		dfs(0,n,1);
	}
	poly gen()const{
		return t[1].a;
	}
	template<class ite>
	poly gen(const ite&b)const{
		ite t=b;
		return gen(t);
	}
	template<class ite>
	void val(const ite&b,const poly&f)const{
		ite t=b;
		val(t,f);
	}
	template<class ite>
	seg(int n,ite&x):a(n){
		for(int i=0;i<n;++i)
			a[i]=*x++;
		dfs(0,n,1);
	}
	template<class ite>
	poly gen(ite&b)const{
		poly f=t[1].a;
		f.der();
		return gen(0,a.size(),1,b,f);
	}
	template<class ite>
	void val(ite&b,const poly&f)const{
		val(0,a.size(),1,b,f);
	}
private:
	struct pair{
		poly a,b;
	};
	vector<pair>t;
	vector<u32>a;
	void dfs(int x,int y,int k){
		if(t.size()<=k)
			t.resize(k+1);
		if(y-x<=200){
			t[k].a=poly::gen(y-x,a.begin()+x);
		}else{
			int m=x+y>>1,i=k<<1,j=i^1;
			dfs(x,m,i);
			dfs(m,y,j);
			int n=len(y-x+1);
			t[i].b=t[i].a;
			t[i].b.dft(n);
			t[j].b=t[j].a;
			t[j].b.dft(n);
			t[k].a=t[i].b;
			for(int l=0;l<n;++l)
				t[k].a[l]=(u64)t[k].a[l]*t[j].b[l]%p;
			t[k].a.idft();
		}
	}
	template<class ite>
	void val(int x,int y,int k,ite&b,poly f)const{
		if(k!=1)
			f.mod(t[k].a,t[k].b);
		else
			f.mod(t[k].a);
		if(y-x<=200){
			for(int i=0;i<y-x;++i)
				*b++=f(a[x+i]);
		}else{
			int m=x+y>>1,i=k<<1,j=i^1;
			val(x,m,i,b,f);
			val(m,y,j,b,f);
		}
	}
	template<class ite>
	poly gen(int x,int y,int k,ite&b,poly f)const{
		if(k!=1)
			f.mod(t[k].a,t[k].b);
		else
			f.mod(t[k].a);
		if(y-x<=200){
			vector<u64>c(y-x);
			for(int i=0;i<y-x;++i){
				u64 n=a[x+i];
				u64 m=*b++;
				m=m*num::inv(f(n))%p;
				u64 s=0;
				for(int j=y-x;j>0;--j){
					s=(t[k].a[j]+s*n)%p;
					c[j-1]+=s*m%p;
				}
			}
			poly d(y-x);
			for(int i=0;i<y-x;++i)
				d[i]=c[i]%p;
			return d;
		}else{
			int m=x+y>>1;
			int i=k<<1;
			int j=i^1;
			poly c=gen(x,m,i,b,f);
			poly d=gen(m,y,j,b,f);
			int n=len(y-x+1);
			c.dft(n);
			d.dft(n);
			for(int l=0;l<n;++l)
				c[l]=((u64)c[l]*t[j].b[l]+(u64)d[l]*t[i].b[l])%p;
			c.idft();
			return c;
		}
	}
};
template<class ite1,class ite2>
poly::poly(int n,ite1 x,ite2 y){
	*this=seg(n,x).gen(y);
}
template<class ite1,class ite2>
void poly::val(int n,ite1 x,ite2 y)const{
	int m=size();
	if(min(m,n)<=100)
		for(int i=0;i<n;++i)
			*y++=val(*x++);
	else
		for(int l=n;;l/=2)
			if(l*2<=m){
				for(int i=0;i<n;i+=l)
					seg(min(l,n-i),x).val(y,*this);
				break;
			}
}

2018-08-14

计划今后增加$O(nlog^2n)$求多项式gcd的算法。

2018-08-18

增加了$O(n^2)$的gcd，未保证结果为首一多项式。
分离了基础部分和点值有关部分。

2018-08-19

为避免影响编译器优化，删去了在运行时确定模数的功能。

2019-03-17

增加了sin/cos/tan。

2019-06-28

修复了除法中非预期地降低效率的问题。