「学习笔记」FFT及NTT入门知识

前言

快速傅里叶变换（( ext{Fast Fourier Transform,FFT}) ）是一种能在(O(n log n))的时间内完成多项式乘法的算法，在(OI)中的应用很多，是多项式相关内容的基础。下面从头开始介绍( ext{FFT})。

前置技能：弧度制、三角函数、平面向量。

多项式

形如(f(x)=a_0+a_1x+a_2x^2+...+a_nx^n)的式子称为(x)的(n)次多项式。其中(a_0,a_1,...,a_n)称为多项式的系数。

系数表达法

上面定义中的表示就是系数表达法。其系数可看成(n+1)维向量(vec a=(a_0,a_1,...,a_n))。

点值表达法

把多项式看成一个函数，点值表示就用它图像上的(n+1)个不同的点((x_0,y_0),...,(x_n,y_n))来确定这个多项式。多项式有不止一个点值表示，可以证明每个点值表示确定唯一的系数表达多项式。

复数

虚数单位

(i)被称为虚数单位。规定(i=sqrt {-1})。

复平面

复数的平面由(x,y)轴组成。(x)轴称为实轴，(y)轴称为虚轴。平面内的每一个从原点到某个点((a,b))的向量(vec a=(a,b))表示复数(a+bi).

复数的模长：(sqrt {a^2+b^2}).实轴到复数向量的转角( heta)称为幅角。

复数的基本运算

复数的加（减）法：((a+bi)+(c+di)=(a+c)+(b+d)i)
复数的乘法：((a+bi)(c+di)=(ac-bd)+(bc+ad)i)
一个口诀：复数乘法，模长相乘，幅角相加。可以用下面将提到欧拉公式证明。

共轭复数

(a+bi)与(a-bi)互为共轭复数。图像上是关于x轴对称的。

单位根

(n)次单位根是满足(z^n=1)的(n)个复数，它们均分复平面的单位圆。

这些复数满足模长为(1)，幅角的(n)倍是(2pi)的倍数

欧拉公式：(e^{xi}=cos x+i sin x)，其中(e)为自然对数的底数，(i)为虚数单位。

（p.s. 欧拉公式的证明可以使用泰勒展开）

(n)次单位根有n个，为(e^{frac{2pi ki}{n}},kin [0,n-1])

我们记(omega_n=e^{frac{2pi i}{n}},)则(n)次单位根为(omega_n^0,...,omega_n^{n-1})

上面是数学上单位根定义，还有一种更易理解的方法：

单位根均分复平面单位圆，那(w_n)的幅角就是(frac{2pi}{n})，根据三角函数即可得到。

单位根的性质

性质(1)：根据定义得到：(omega_{2n}^{2k}=omega_{n}^{k})（被叫做折半定理，是消去定理的特殊情形）

性质(2)：(omega_{n}^{frac{n}{2}+k}=-omega_n^k)

证明：

(omega_{n}^{frac{n}{2}}=e^{frac{2pi i}{n} frac{n}{2}}=e^{pi i}=cos pi+i sin pi=-1)

(omega_{n}^{frac{n}{2}+k}=omega_{n}^{frac{n}{2}}omega_{n}^{k}=-omega_n^k)

性质(2)图像上理解是转半圈。

Fast Fourier Transform

多项式乘法

系数表达的多项式乘法：(c(x)=a(x)b(x))，则(c(x)=sum_{i=0}^{2n} c_i x^i)

其中(c_i=sum_{j=0}^{n}a_jb_{i-j}).

时间复杂度(O(n^2))

点值表达的多项式乘法：取相同的一组的(x)，(y)值相乘即可

时间复杂度(O(n))

因此多项式乘法的基本思路是先插值得到点值表达，再(O(n))乘，最后求值得到系数表达。

DFT

把(n)次单位根(omega_n^0,...,omega_n^{n-1})带入多项式(A(x)=a_0+a_1x+...+a_{n-1}x^{n-1})，

得到点值向量(vec y=(A(omega_n^0),A(omega_n^1),...,A(omega_n^{n-1})))，

称为系数向量(vec a=(a_0,a_1,...,a_n))的离散傅里叶变换（( ext{Discrete Fourier Transform, DFT})），写作(vec y= ext{DFT}_n(vec a))。

直接求( ext{DFT})是(O(n^2))的。( ext{FFT})的常用算法( ext{Cooley-Tukey})使用分治方法做到(O(nlog n)).

以下讨论基于(n=2^m,m in N^*)，若不足则高位系数补(0).（注意这里(n)是次数界，即最高次项为(x^{n-1})）

考虑点值向量的第(k+1)维（(k<frac{n}{2})）：

(A(omega_{n}^{k})=sum_{i=0}^{n-1}a_i(omega_{n}^{k})^{i}=sum_{i=0}^{n-1}a_iomega_{n}^{ki})

(=sum_{i=0}^{frac{n}{2}-1}a_{2i}omega_{n}^{2ki}+sum_{i=0}^{frac{n}{2}-1}a_{2i+1}omega_{n}^{2ki+k})

(=sum_{i=0}^{frac{n}{2}-1}a_{2i}omega_{n}^{2ki}+omega_{n}^{k}sum_{i=0}^{frac{n}{2}-1}a_{2i+1}omega_{n}^{2ki})

利用性质1：(omega_{2n}^{2k}=omega_{n}^{k})

(A(omega_{n}^{k})=sum_{i=0}^{frac{n}{2}-1}a_{2i}omega_{frac{n}{2}}^{ki}+omega_{n}^{k}sum_{i=0}^{frac{n}{2}-1}a_{2i+1}omega_{frac{n}{2}}^{ki})

利用性质2：(omega_{n}^{frac{n}{2}+k}=-omega_n^k)

可以推出：

(A(omega_{n}^{k+frac{n}{2}})=(-1)^{frac{n}{2}}sum_{i=0}^{frac{n}{2}-1}a_{2i}omega_{frac{n}{2}}^{ki}+(-1)^{frac{n}{2}}omega_{n}^{k+frac{n}{2}}sum_{i=0}^{frac{n}{2}-1}a_{2i+1}omega_{frac{n}{2}}^{ki})

(A(omega_{n}^{k+frac{n}{2}})=sum_{i=0}^{frac{n}{2}-1}a_{2i}omega_{frac{n}{2}}^{ki}-omega_n^ksum_{i=0}^{frac{n}{2}-1}a_{2i+1}omega_{frac{n}{2}}^{ki})

为了简记，偶数、奇数项系数用(A_0,A_1)表示，则上面的式子可以写成以下形式

(A(omega_{n}^{k})=A_0(omega_{frac{n}{2}}^k)+omega_{n}^{k}A_1(omega_{frac{n}{2}}^k))

(A(omega_{n}^{k+frac{n}{2}})=A_0(omega_{frac{n}{2}}^k)-omega_{n}^{k}A_1(omega_{frac{n}{2}}^k))

上面把求和分成(0,2,...,n-2)与(1,3,...,n-1)两部分，把大小为(n)的问题转化成两个规模为(frac{n}{2})的子问题，可以进行分治求解了。

IDFT

求值过程使用离散傅里叶逆变换（( ext{Inverse Discrete Fourier Transform, IDFT})）

结论：只要把( ext{DFT})的(omega_n)都取倒数（共轭复数），最后除以(n)即可。

证明：

设(vec Y=(y_0,y_1,...,y_n))为(vec A = (a_0,a_1,...,a_n))的离散傅里叶变换。

考虑一个向量：(vec C=(c_0,c_1,...,c_n))满足(c_k=sum_{i=0}^{n-1}y_i(omega_n^{-k})^i)

（即(vec C)是多项式(vec Y)在(omega_n^0,omega_n^{-1},...,omega_n^{-(n-1)})处的点值）

将上式展开：

(c_k=sum_{i=0}^{n-1}y_i(omega_n^{-k})^i)

(=sum_{i=0}^{n-1}(sum_{j=0}^{n-1}a_j(omega_n^i)^j)(omega_n^{-k})^i)

(=sum_{i=0}^{n-1}(sum_{j=0}^{n-1}a_j(omega_n^j)^i)(omega_n^{-k})^i)

(=sum_{i=0}^{n-1}sum_{j=0}^{n-1}a_j(omega_n^j)^i(omega_n^{-k})^i)

(=sum_{i=0}^{n-1}sum_{j=0}^{n-1}a_j(omega_n^{j-k})^i)

(=sum_{j=0}^{n-1}a_j(sum_{i=0}^{n-1}(omega_n^{j-k})^i))

考虑一个前缀和(S(omega_n^k)=1+omega_n^k+(omega_n^k)^2+...+(omega_n^k)^{n-1})。

当((omega_n^k) ot = 1)即(k ot = 0)时，使用等比数列求和方法：

(omega_n^kS(omega_n^k)=omega_n^k+(omega_n^k)^2+(omega_n^k)^3+...+(omega_n^k)^{n})

(omega_n^kS(omega_n^k)-S(omega_n^k)=(omega_n^k)^{n}-1)

(S(omega_n^k)=frac{(omega_n^k)^{n}-1}{omega_n^k-1})

分母不为(0)，分子((omega_n^k)^{n}-1=(omega_n^n)^{k}-1=1^{k}-1=0)

因此(k ot = 0)时，(S(omega_n^k)=0)

(k=0)时，(S(omega_n^k)=n(omega_n^k)^0=n)

继续考虑刚刚那个式子

(c_k=sum_{j=0}^{n-1}a_j(sum_{i=0}^{n-1}(omega_n^{j-k})^i))

只有(j-k=0)时(sum_{i=0}^{n-1}(omega_n^{j-k})^i)才为(n)，否则为(0)。

(c_k=a_kn)

得到结论：(a_k=frac{c_k}{n})。

上面也可以用矩阵证（更加优美），太麻烦了就不写了。

再次总结一下，离散傅里叶逆变换就是先求出多项式在(omega_n^0,omega_n^{-1},...,omega_n^{-(n-1)})处的点值表示，再每一项除以(n)。和上面的分治求值没有区别，因为这些点值性质完全相同。

递归版代码

按照如上所述的方法可以轻松写出一份递归代码。

//Luogu P3803 多项式乘法 - 递归FFT
#include <complex>
#include <cstdio>
using namespace std;

typedef complex<double> comp;

const int N = (1 << 20) + 10 << 1;
const double PI2 = 2.0 * acos(-1.0);

int read() {
	int x = 0; char c = getchar();
	for(; c < '0' || c > '9'; c = getchar()) ;
	for(; c >= '0' && c <= '9'; c = getchar())
		x = x * 10 + (c & 15);
	return x;
}

int n, m;
comp a[N], b[N];

void fft(int n, comp * a, int type) {
	if(n == 1) return ;
	comp a1[n >> 1], a2[n >> 1];
	for(int i = 0; i < n; i += 2)
		a1[i >> 1] = a[i], a2[i >> 1] = a[i + 1];
	fft(n >> 1, a1, type), fft(n >> 1, a2, type);
	comp w(1, 0), wn(cos(PI2 / n), type * sin(PI2 / n));
	for(int i = 0; i < n >> 1; i ++, w *= wn)
		a[i] = a1[i] + w * a2[i], 
		a[i + (n >> 1)] = a1[i] - w * a2[i];
}

int main() {
	n = read(), m = read();
	for(int i = 0; i <= n; i ++) a[i] = read();
	for(int i = 0; i <= m; i ++) b[i] = read();
	
	int lim = 1;
	for(; lim <= n + m; lim <<= 1) ;
	
	fft(lim, a, 1), fft(lim, b, 1);
	for(int i = 0; i <= lim; i ++) a[i] *= b[i];
	fft(lim, a, -1);
	
	for(int i = 0; i <= n + m; i ++)
		printf("%d ", (int)(0.5 + a[i].real() / lim));
	return 0;
}

迭代优化

通过观察得到：多项式的(i)次项到分治边界时下标为(r[i]),(r[i])为(i)二进制翻转后的数

我们可以先把系数分到底层的位置，然后一层一层往上做。

//Luogu P3803 多项式乘法 - 迭代FFT 
#include <complex>
#include <cstdio>
using namespace std;

typedef complex<double> comp;

const int N = (1 << 21) + 10;
const double PI = acos(-1);

int read() {
	int x = 0; char c = getchar();
	for(; c < '0' || c > '9'; c = getchar()) ;
	for(; c >= '0' && c <= '9'; c = getchar())
		x = x * 10 + (c & 15);
	return x;
}

int n, m, lim, r[N];
comp a[N], b[N];

void fft(comp * a, int type) {
	for(int i = 0; i < lim; i ++)
		if(i < r[i]) swap(a[i], a[r[i]]);
	for(int i = 1; i < lim; i <<= 1) {
		comp x(cos(PI / i), type * sin(PI / i));
		for(int j = 0; j < lim; j += (i << 1)) {
			comp y(1, 0);
			for(int k = 0; k < i; k ++, y *= x) {
				comp p = a[j + k], q = y * a[j + k + i];
				a[j + k] = p + q; a[j + k + i] = p - q;
			}
		}
	}
}

int main() {
	n = read(), m = read();
	for(int i = 0; i <= n; i ++) a[i] = read();
	for(int i = 0; i <= m; i ++) b[i] = read();
	
	int l = 0;
	for(lim = 1; lim <= n + m; lim <<= 1) ++ l;
	for(int i = 0; i < lim; i ++)
		r[i] = (r[i >> 1] >> 1) | ((i & 1) << (l - 1));
		
	fft(a, 1), fft(b, 1);
	for(int i = 0; i <= lim; i ++) a[i] *= b[i];
	fft(a, -1);
	
	for(int i = 0; i <= n + m; i ++)
		printf("%d ", (int)(0.5 + a[i].real() / lim));
	return 0;
}

upd：我们有更好的写法，预处理单位根

typedef double db;
typedef long long ll;
const db pi = acos(-1.0);
const int N = 1 << 21 | 5; // 2n^2
const int M = 1 << 22 | 5;
struct comp_t {
	db x, y;
	comp_t() {}
	comp_t(db a, db b) : x(a), y(b) {}
	comp_t operator + (const comp_t &b) const { return comp_t(x + b.x, y + b.y); }
	comp_t operator - (const comp_t &b) const { return comp_t(x - b.x, y - b.y); }
	comp_t operator * (const comp_t &b) const { return comp_t(x * b.x - y * b.y, b.x * y + x * b.y); }
	inline void rev() { y = -y; }
} wnk[M];
int lim, r[M], A[M], B[M], n;
ll ans[N];
void init(int len) {
	int l = 0;
	for(lim = 1; lim <= len; lim <<= 1) l ++;
	for(int i = 1; i < lim; i ++) {
		r[i] = (r[i >> 1] >> 1) | ((i & 1) << (l - 1));
	}
	wnk[0] = comp_t(1, 0);
	wnk[1] = comp_t(cos(2 * pi / lim), sin(2 * pi / lim));
	for(int i = 2; i < lim; i ++) wnk[i] = wnk[i - 1] * wnk[1];
}
void fft(comp_t *a, int t) {
	for(int i = 1; i < lim; i ++)
		if(i < r[i]) swap(a[i], a[r[i]]);
	for(int i = 1; i < lim; i <<= 1) {
		for(int j = 0; j < lim; j += i << 1) {
			for(int k = 0; k < i; k ++) {
				comp_t y = wnk[lim / (i << 1) * k];
				if(t == -1) y.rev();
				comp_t t = y * a[j + k + i];
				a[j + k + i] = a[j + k] - t;
				a[j + k] = a[j + k] + t;
			}
		}
	}
}
ll *const_mul(int *a, int *b, int n, int m) {
	static ll ans[M];
	static comp_t A[M], B[M];
	init(n + m);
	for(int i = 0; i < lim; i ++) A[i] = comp_t(i <= n ? a[i] : 0, 0);
	for(int i = 0; i < lim; i ++) B[i] = comp_t(i <= m ? b[i] : 0, 0);
	fft(A, 1); fft(B, 1);
	for(int i = 0; i < lim; i ++) A[i] = A[i] * B[i];
	fft(A, -1);
	for(int i = 0; i <= n + m; i ++) ans[i] = (ll) (A[i].x / lim + 0.5);
	return ans;
}

NTT 快速数论变换

（若不了解原根的基础知识，可以阅读 Hongzy：数学相关中的内容）

对于一类特殊形式质数(p=r 2^k+1)，模(p)意义下做多项式乘法可以使用NTT。

回顾一下我们用到单位根三条性质：

(omega_n^n=omega_n^0=1)（逆变换中所用）
(omega_n^0,omega_n^1,omega_n^2,...,omega_n^{n-1})互不相同（点值表示的要求）
(omega_{2n}^{2k}=omega_{n}^{k})，(omega_{n}^{frac{n}{2}+k}=-omega_n^k)（分治基础）

根据(nmid p-1)启发，我们找到一个东西(g_n=g^{frac{p-1}{n}})（即(g^r)），也满足这三条性质：

(g_n^n=g_n^0=1)（证明：费马小定理）
(g_{n}^0,g_{n}^1,g_{n}^2,...,g_{n}^{n-1})互不相同（根据原根的性质，(g_n^0)到(g^{p-2})都是不同的）
(g_{2n}^{2k}=g^{frac{2k(p-1)}{2n}}=g^{frac{k(p-1)}{n}}=g_n^k,g_n^{frac{n}{2}+k}=g_n^k g_n^{frac{n}{2}}=-g_n^{k})

注意(3)的最后一步用到了(g_n^{frac{n}{2}}=g^{frac{p-1}{n}frac{n}{2}}=g^{frac{p-1}{2}})。由于(g)不是二次剩余，(g^{frac{p-1}{2}}=-1)

代码：

//UOJ#34. 多项式乘法
#include <algorithm>
#include <cstdio>
using namespace std;

const int MOD = 998244353;
const int N = 1e6 + 10;

int n, m, L, r[N], g[N], a[N], b[N];

int qpow(int a, int b) {
	int ans = 1;
	for(; b; b >>= 1, a = a * 1ll * a % MOD)
		if(b & 1) ans = ans * 1ll * a % MOD;
	return ans;
}

void ntt(int *a, int f) {
	for(int i = 0; i < n; i ++)
		if(i < r[i]) swap(a[i], a[r[i]]);
	for(int i = 1; i < n; i <<= 1) {
		int gn = qpow(3, (MOD - 1) / (i << 1)), x, y;
		for(int j = 0; j < n; j += (i << 1)) {
			int g = 1;
			for(int k = 0; k < i; k ++, g = 1ll * g * gn % MOD) {
				x = a[j + k]; y = 1ll * g * a[i + j + k] % MOD;
				a[j + k] = (x + y) % MOD;
				a[i + j + k]=(x - y + MOD) % MOD;
			}
		}
	}
	if(f == 1) return;
	reverse(a + 1, a + n);
	int y = qpow(n, MOD - 2);
	for(int i = 0; i < n; i ++) 
		a[i] = 1ll * a[i] * y % MOD;
}

int main() {
	scanf("%d%d", &n, &m);
	for(int i = 0; i <= n; i ++) 
		scanf("%d", &a[i]);
	for(int i = 0; i <= m; i ++) 
		scanf("%d", &b[i]);
	m += n;
	for(n = 1; n <= m; n <<= 1) L ++;
	for(int i = 0; i < n; i ++)
		r[i] = (r[i >> 1] >> 1) | ((i & 1) << (L - 1));
	ntt(a, 1); ntt(b, 1);
	for(int i = 0; i < n; i ++) 
		a[i] = 1ll * a[i] * b[i] % MOD;
	ntt(a, -1);
	for(int i = 0; i <= m; i ++)
		printf("%d ", a[i]);
	return 0;
}

结语

参考博客：