「十二省联考 2019」希望（长链剖分优化dp）

Solution

题意简述：选出 $k$ 个树上连通块，使得存在一个点 $u$ 满足：
1.$u$ 在这 $k$ 个连通块的交集之中。
2.对于这 $k$ 个连通块中的任意一点 $v$，都有：$dist(v,u)≤L$。

1.容斥

显然对于每一个连通块集合，满足条件的点 $u$ 构成的也是一个连通块，记这个连通块为 $S$。
我们钦定根节点为1。记 $u$ 的父亲为 $fa[u]$ 。记所有合法方案中，$S$ 包含 $u$ 的方案数为 $A(u)$，包含边 $(u,fa[u])$ 的方案数为 $B(u)$，那么 $\sum_{i=1}^{n}A(i)-\sum_{i=2}^{n}B(i)$ 就是答案。
考虑这样算为什么是对的：
对于 $S$ 中的每个点 $u$，$A(u)$ 中都包含此方案。对于 $S$ 中的每条边 $(v,fa[v])$，$B(v)$ 中都包含此方案。众所周知，树上连通块有一个~~绝妙的~~性质：点数 $=$ 边数 $+1$。那么 $u$ 的个数会比 $v$ 的个数多 $1$，也就是说此合法方案正好被统计一次。由此可得，每个合法方案都正好被统计一次，那么这样算就是对的。

2.朴素dp

记 $f[u][i]$ 表示满足以下条件的连通块 $T$ 的个数 $+1$：
1.$T$ 中必须包含 $u$。
2.$T$ 中只能包含 $u$ 子树内的点。
3.$T$ 中任意一点 $v$ 均满足 $dist(u,v)\le i$。
初值：$f[u][0]=2$。
$dp$式：$f[u][i]=\prod_{v∈child[u]}f[v][i-1]+1$。
记 $g[u][i]$ 表示满足以下条件的连通块 $T$ 的个数：
1.$T$ 中必须包含 $u$。
2.$T$ 中只能包含 $u$ 和 $u$ 子树外的点。
3.$T$ 中任意一点 $v$ 均满足 $dist(u,v)\le i$。
初值：$g[u][0]=1$。
$dp$式：$g[v][i]=g[u][i-1]*\prod_{x∈child[u]且x!=v}f[x][i-2]+1$。
特殊地，$i=1$ 时不用乘 $\prod_{x∈child[u]且x!=v}f[x][i-2]$。
$A(u)=[(f[u][L]-1)*(g[u][L])]^k$
$B(u)=[(f[u][L-1]-1)*(g[u][L]-1)]^k$

3.长链剖分优化$f$

考虑如果 $v$ 是 $u$ 的轻儿子怎么转移：
记 $mx[v]$ 为点 $v$ 子树里深度最大的点到 $v$ 的距离。
转移 $f[u][i]=f[v][i-1]+1$ 的时候，$i$ 最大会到 $mx[u]$。但是，为了保证时间复杂度为 $\sum$ 链长，$i$ 是不可以枚举到 $mx[u]$ 的。
怎么办呢？我们发现对于任意 $i-1>mx[v]$，都有 $f[v][i-1]=f[v][mx[v]]$。
那么我们不用枚举到 $mx[u]$。我们只要枚举 $i$ 到 $mx[v]+1$ 就可以了。
至于 $v$ 对 $f[u][mx[v]+2...mx[u]]$ 的贡献，我们考虑打一个标记 $mul[u]$，表示 $f[u][0...mx[u]]$ 都乘上 $mul[u]$。
显然要： $mul[u]*=f[v][mx[v]]$。
然后对于 $f[u][0...mx[v]+1]$，暴力乘上 $f[v][mx[v]]$ 的逆元即可。这样时间复杂度就是对的了。
还有注意一点，$f[v][mx[v]]$ 的逆元不可以用快速幂计算（太慢），要提前 $O(n)$ 预处理所有的 $f[v][mx[v]]$，然后 $O(n)$ 求所有 $f[v][mx[v]]$ 的逆元。不会线性求逆元的左转 Luogu5431。
然后不是递推式的末尾有个 $+1$ 吗，那么再记个 $add[u]$。现在 $f[u][i]$ 的真实值就是 $f[u][i]*mul[u]+add[u]$ 了。
然后为了保证 $f[u][i]*mul[u]+add[u]$ 是 $f[u][i]$ 的真实值，我们递推的时候不能直接 $f[u][i]*=f[v][i-1]$，而是要这样：
记 $ask0(u,i)$ 表示 $f[u][i]$ 真实值。
记 $ask1(u,res)$ 表示已知 $f[u][i]$ 的真实值为 $res$，求 $f[u][i]$。
显然：$ask1(u,res)=(res-add[u])*imul[u]$，其中 $imul[u]$ 是 $mul[u]$ 的逆元，维护 $mul[u]$ 的同时也要维护 $imul[u]$。
转移：$f[u][i]=ask1(ask0(u,i)*ask0(v,i-1),i)$。
然后暴力乘逆元的时候也要类似地利用 $ask1,ask0$。
如果 $v$ 是重儿子，直接把 $f[v],imul[v],mul[v],add[v]$ 都传给 $u$ 就行了。
但是，如果 $f[v][mx[v]]\mod 998244353 = 0$ 呢？
那么此时相当于把 $f[u][mx[v]+1...mx[u]]$ 都赋值成 $0$。
我们考虑多记两个标记 $lim[u],zero[u]$，然后定义:
若 $i<lim[u],ask0(u,i)=f[u][i]*mul[u]+add[u]$，
否则 $ask0(u,i)=zero[u]*mul[u]+add[u]。$
那么如果 $f[v][mx[v]]=0$，令 $lim[u]=mx[v]+2,zero[u]=ask1(u,0)$。
转移轻儿子 $v$，枚举到 $i$ 的时候，如果发现 $lim[u]==i$，说明此时 $lim[u]$ 的值需要增加。那么 $lim[u]++,f[u][i]=zero[u]$ 即可。

长链剖分优化f-参考程序

int *f[e], tmp1[e * 10], *it = tmp1 + 2;

namespace sf
{
	int mul[e], imul[e], add[e], lim[e], zero[e];
	
	inline void init(int u)
	{
		f[u] = it;
		it += (mx[u] + 5) * 2;
	}
	
	inline int ask0(int u, int i)
	{
		i = min(i, mx[u]);
		if (lim[u] <= i) return ((ll)mul[u] * zero[u] + add[u]) % mod;
		return ((ll)mul[u] * f[u][i] + add[u]) % mod;
	}
	
	inline int ask1(int u, int res)
	{	
		return (ll)sub(res, add[u]) * imul[u] % mod;
	}
	
	inline void dfs3(int u)
	{
		if (!son[u])
		{
			mul[u] = imul[u] = 1; add[u] = 2; lim[u] = n + 1;
			f1[u] = sub(ask0(u, L), 1); f2[u] = sub(ask0(u, L - 1), 1);
			return;
		}
		else
		{
			f[son[u]] = f[u] + 1; dfs3(son[u]); add[u] = add[son[u]]; 
			mul[u] = mul[son[u]]; imul[u] = imul[son[u]]; lim[u] = lim[son[u]] + 1;
			zero[u] = zero[son[u]]; f[u][0] = ask1(u, 1);
		}
		for (auto v : adj[u])
		{
			if (v == son[u]) continue;
			init(v); dfs3(v);
			for (int i = 0; i <= mx[v] + 1; i++)
			{
				if (lim[u] == i) f[u][lim[u]++] = zero[u];
				f[u][i] = ask1(u, (ll)ask0(u, i) * (i ? ask0(v, i - 1) : 1) % mod);
			} 
			if (!p[v])
			{
				lim[u] = mx[v] + 2; zero[u] = ask1(u, 0);
			}
			else
			{
				mul[u] = (ll)mul[u] * p[v] % mod; add[u] = (ll)add[u] * p[v] % mod;
				imul[u] = (ll)imul[u] * inv[v] % mod;
				for (int i = 0; i <= mx[v] + 1; i++)
				f[u][i] = ask1(u, (ll)ask0(u, i) * inv[v] % mod);
			}
		}
		add[u] = plu(add[u], 1); 
		f1[u] = sub(ask0(u, L), 1); f2[u] = sub(ask0(u, L - 1), 1);
		// f1[u]=f[u][L]真实值-1，f2[u]=f[u][L-1]真实值-1
	}
}

4.长链剖分优化g

回顾 $g$ 的 $dp$ 式：
$g[v][i]=g[u][i-1]*\prod_{x∈child[u]且x!=v}f[x][i-2]+1$。
对于 $g[v][i]=g[u][i-1]$ 这一部分，直接把 $g$ 传给重儿子，然后轻儿子暴力转移即可。
注意轻儿子只要转移到 $g[v][max(L-mx[v],0)...L]$。
然后 $\prod f[x][i-2]$ 怎么办呢？
对于重儿子依然可以暴力计算。和 $f$ 一样，也要记 $lim,add,imul,mul,zero$。
对于轻儿子呢？我们发现它等于 $\frac{f[u][i-1]-1}{f[v][i-2]}$，但要是 $f[v][i-2] \mod 998244353 =0$ 呢？
所以我们只能把它拆成一段前缀和一段后缀相乘的形式。
先考虑前缀怎么办：
我们把轻儿子按 $mx[v]$ 升序排序。然后记 $b[i]$ 表示：$$\prod_{x的dfs序≤v且x∈child[u]}f[x][i]$$
也就是在枚举到 $v$ 的时候把 $f[v][0...mx[v]]$ 计入 $b[0...mx[v]]$ 就行了。
然后对于 $b[mx[v]+1...∞]$，显然 $v$ 对它们的贡献相同，那么额外记一个值就行了。
大概就是这样：

int now = 0, tot = 1;
for (int i = 0; i <= mx[v]; i++)
if (i > now) b[i] = (ll)tot * sf::ask0(v, i) % mod;
else b[i] = (ll)b[i] * sf::ask0(v, i) % mod;
now = mx[v]; 
tot = (ll)tot * sf::ask0(v, mx[v]) % mod; //额外记一个 tot

我们发现计算 $f[u][i]$ 的时候，$f[u][i]$ 的真实值要不断乘上 $f[v][i-1]$。也就是说，枚举到轻儿子 $v$ 的时候，$f[u][i]$ 的真实值是 $$\prod_{x的dfs序≤v且x∈child[u]}f[x][i-1]$$
这就是一段前缀的形式了。如果我们计算 $g$ 的时候，把子节点的 $dfs$ 顺序全部反过来，那它就是一段后缀的形式了。
那就是说，在计算 $f$ 的时候，把轻儿子按 $mx[v]$ 降序排序，然后计算 $g$ 的时候反过来就行了。
但是我们现在并没有存下对于每个 $v$，上式的值。
那么我们要做的就是：假设计算 $f$ 的时候，儿子的 $dfs$ 顺序为：$v_1,v_2,v_3,...,v_m$。
然后现在反过来，枚举到 $v_m$ 的时候，我们要算出：$\prod_{j=1}^{m-1}f[v_j][i]$，枚举到 $v_{m-1}$ 的时候，我们要算出：$\prod_{j=1}^{m-2}f[v_j][i]$……
然后把算出的这个和 $b$ 相乘就可以得出 $\prod f[x][i-2]$ 了。
具体地，我们可以在计算 $f$ 的时候，枚举到每个轻儿子 $v_j$ 的时候，都记一下在计算 $v_j$ 的贡献之前，$f[u][i]$ 的真实值。也就是对于每个 $v_j$ 都记下 $\prod_{k=1}^{j-1}f[v][i-1]$。
但是不能直接把真实值记下来。因为计算 $f$ 的时候转移的是 $f[v][0...mx[v]+1]$。而计算 $g$ 的时候要算的是 $g[v][max(L-mx[v],0)...L]$。
所以我们在计算 $f$ ，枚举到轻儿子 $v$ 的时候，如果 $f[u][i],lim[u],zero[u],add[u],mul[u],imul[u]$ 中任意一个的值改变了，都要把改变之前的值记下来。
最后 $f[u][i]$ 的值有 $+1$，看作是枚举到最后一个轻儿子时做的修改。
具体实现时可以对每个 $v$ 开一个栈（$list$实现），计算 $f$ 的时候记录下修改的地址和值，然后计算 $g$ 的时候，按从栈顶到栈底的顺序还原这些元素的值。然后利用 $sf::ask0$ 就能知道 $\prod_{k=1}^{j-1}f[v][i-1]$ 的真实值了。

Code

#include <bits/stdc++.h>

using namespace std;

#define ll long long
#define pb push_back

template <class t>
inline void read(t & res)
{
	char ch;
	while (ch = getchar(), !isdigit(ch));
	res = ch ^ 48;
	while (ch = getchar(), isdigit(ch))
	res = res * 10 + (ch ^ 48);
}

const int e = 1e6 + 5, mod = 998244353;
vector<int>adj[e], h[e];
int *f[e], tmp1[e * 10], *it = tmp1 + 2, ans, n, L, fa[e], k, mx[e], b[e], ret[e];
int son[e], p[e], inv[e], pre[e], suf[e], f1[e], f2[e], *g[e], tmp2[e * 10];
struct point
{
	int x, y;
}a[e]; 

inline int plu(int x, int y)
{
	x += y;
	if (x >= mod) x -= mod;
	return x;
}

inline int sub(int x, int y)
{
	x -= y;
	if (x < 0) x += mod;
	return x;
}

inline int ksm(int x, int y)
{
	int res = 1;
	while (y)
	{
		if (y & 1) res = (ll)res * x % mod;
		y >>= 1;
		x = (ll)x * x % mod;
	}
	return res;
}

inline void dfs0(int u, int pa)
{
	fa[u] = pa;
	for (auto v : h[u])
	{
		if (v == pa) continue;
		dfs0(v, u);
	}
}

inline bool cmp(int x, int y)
{
	return mx[x] > mx[y];
}

inline void dfs1(int u)
{
	for (auto v : adj[u])
	{
		dfs1(v);
		mx[u] = max(mx[u], mx[v] + 1);
		if (mx[v] > mx[son[u]]) son[u] = v;
	}
	sort(adj[u].begin(), adj[u].end(), cmp);
}

inline void dfs2(int u)
{
	p[u] = 1;
	for (auto v : adj[u])
	{
		dfs2(v);
		p[u] = (ll)p[u] * p[v] % mod;
	}
	p[u] = plu(p[u], 1);
}

inline void prepare() // 线性求逆元
{
	int i; pre[0] = 1;
	for (i = 1; i <= n; i++) 
	if (p[i]) pre[i] = (ll)pre[i - 1] * p[i] % mod;
	else pre[i] = pre[i - 1];
	suf[n] = ksm(pre[n], mod - 2);
	suf[n + 1] = 0;
	for (i = n - 1; i >= 0; i--) 
	if (p[i + 1]) suf[i] = (ll)suf[i + 1] * p[i + 1] % mod;
	else suf[i] = suf[i + 1];
	for (i = 1; i <= n; i++) inv[i] = (ll)pre[i - 1] * suf[i] % mod; 
}

struct work
{
	struct node
	{
		int *w, v; // 记录修改的地址和修改之前的值
	};
	list<node>q;
	
	inline void ins(int &x)
	{
		q.pb((node){&x, x});
	}
	
	inline void regain()
	{
		while (!q.empty()) *(q.back().w) = q.back().v, q.pop_back(); // 还原 
	}
}q[e];

namespace sf
{
	int mul[e], imul[e], add[e], lim[e], zero[e];
	
	inline void init(int u) // 地址分配
	{
		f[u] = it;
		it += (mx[u] + 5) * 2;
	}
	
	inline int ask0(int u, int i)
	{
		i = min(i, mx[u]);
		if (lim[u] <= i) return ((ll)mul[u] * zero[u] + add[u]) % mod;
		return ((ll)mul[u] * f[u][i] + add[u]) % mod;
	}
	
	inline int ask1(int u, int res)
	{	
		return (ll)sub(res, add[u]) * imul[u] % mod;
	}
	
	inline void dfs3(int u)
	{
		if (!son[u])
		{
			mul[u] = imul[u] = 1; add[u] = 2; lim[u] = n + 1;
			f1[u] = sub(ask0(u, L), 1); f2[u] = sub(ask0(u, L - 1), 1);
			return;
		}
		else
		{
			f[son[u]] = f[u] + 1; dfs3(son[u]); add[u] = add[son[u]]; 
			mul[u] = mul[son[u]]; imul[u] = imul[son[u]]; lim[u] = lim[son[u]] + 1;
			zero[u] = zero[son[u]]; f[u][0] = ask1(u, 1);
		}
		int lst = 0;
		for (auto v : adj[u])
		{
			if (v == son[u]) continue;
			init(v); dfs3(v); lst = v;
			for (int i = 0; i <= mx[v] + 1; i++)
			{
				if (lim[u] == i) 
				q[v].ins(lim[u]), q[v].ins(f[u][i]), f[u][lim[u]++] = zero[u];
				q[v].ins(f[u][i]);
				f[u][i] = ask1(u, (ll)ask0(u, i) * (i ? ask0(v, i - 1) : 1) % mod);
			} 
			if (!p[v])
			{
				q[v].ins(lim[u]); q[v].ins(zero[u]);
				lim[u] = mx[v] + 2; zero[u] = ask1(u, 0);
			}
			else
			{
				q[v].ins(mul[u]); q[v].ins(add[u]); q[v].ins(imul[u]);
				mul[u] = (ll)mul[u] * p[v] % mod; add[u] = (ll)add[u] * p[v] % mod;
				imul[u] = (ll)imul[u] * inv[v] % mod;
				for (int i = 0; i <= mx[v] + 1; i++)
				q[v].ins(f[u][i]), f[u][i] = ask1(u, (ll)ask0(u, i) * inv[v] % mod);
			}
		}
		if (lst) q[lst].ins(add[u]);
		add[u] = plu(add[u], 1); 
		f1[u] = sub(ask0(u, L), 1); f2[u] = sub(ask0(u, L - 1), 1);
	}
}

namespace sg
{
	int mul[e], imul[e], add[e], lim[e], zero[e];
	
	inline void init(int u)
	{
		it += mx[u] + 5;
		g[u] = it - max(L - mx[u], 0);
		it += mx[u] + 5;
	}
	
	inline int ask0(int u, int i)
	{
		if (lim[u] <= i) return ((ll)mul[u] * zero[u] + add[u]) % mod;
		else return ((ll)mul[u] * g[u][i] + add[u]) % mod;
	}
	
	inline int ask1(int u, int res)
	{	
		return (ll)sub(res, add[u]) * imul[u] % mod;
	}
	
	inline void dfs4(int u)
	{
		int gu = ask0(u, L), tot = 1, now = 0, x = son[u];
		ans = plu(ans, ksm((ll)f1[u] * gu % mod, k));
		ret[u] = ask0(u, L);
		if (u != 1) 
		{
			gu = sub(gu, 1);
			ans = sub(ans, ksm((ll)f2[u] * gu % mod, k));
		}
		if (!x) return; 
		b[0] = 1; reverse(adj[u].begin(), adj[u].end());
		for (auto v : adj[u])
		{
			if (v == x) continue;
			q[v].regain(); // 还原
			init(v); 
			mul[v] = imul[v] = 1; 
			lim[v] = n + 1;
			for (int i = max(0, L - mx[v]); i <= L; i++)
			{
				g[v][i] = (ll)(i ? ask0(u, i - 1): 1) * 
				(i - 2 > now ? tot : i >= 2 ? b[i - 2] : 1) 
				% mod * (i ? sf::ask0(u, i - 1) : 1) % mod;	
				if (i) g[v][i] = plu(g[v][i], 1);
			}
			for (int i = 0; i <= mx[v]; i++)
			if (i > now) b[i] = (ll)tot * sf::ask0(v, i) % mod;
			else b[i] = (ll)b[i] * sf::ask0(v, i) % mod;
			now = mx[v]; 
			tot = (ll)tot * sf::ask0(v, mx[v]) % mod;
		}
		add[x] = add[u]; mul[x] = mul[u]; imul[x] = imul[u];
		lim[x] = lim[u] + 1; zero[x] = zero[u]; g[x] = g[u] - 1;
		int st = max(L - mx[x], 0);
		for (auto v : adj[u])
		{
			if (v == x) continue; int ed = min(mx[v] + 2, L);
			for (int i = st; i <= ed; i++)
			{
				if (lim[x] == i) g[x][lim[x]++] = zero[x];
				g[x][i] = ask1(x, (ll)ask0(x, i) * 
				(i >= 2 ? sf::ask0(v, i - 2) : 1) % mod);
			}
			if (L <= mx[v] + 2) continue; 
			if (!p[v]) lim[x] = max(mx[v] + 3, L - mx[x]), zero[x] = ask1(x, 0);
			else
			{
				mul[x] = (ll)mul[x] * p[v] % mod; add[x] = (ll)add[x] * p[v] % mod;
				imul[x] = (ll)imul[x] * inv[v] % mod;
				for (int i = st; i <= ed; i++)
				g[x][i] = ask1(x, (ll)ask0(x, i) * inv[v] % mod);
			}
		}
		add[x] = plu(add[x], 1); 
		if (L - mx[x] <= 0) g[x][0] = ask1(x, 1);
		for (auto v : adj[u]) dfs4(v);
	}	
	
	inline void begin()
	{
		mul[1] = imul[1] = add[1] = 1;
		lim[1] = n + 1; init(1);
	}
}

int main()
{
	int i, x, y, j;
	read(n); read(L); read(k); mx[0] = -1;
	for (i = 1; i < n; i++) 
	{
		read(x); read(y);
		a[i].x = x; a[i].y = y;
		h[x].pb(y); h[y].pb(x);
	}
	if (L == 0)
	{
		cout << n << endl;
		return 0;
	}
	dfs0(1, 0);
	for (i = 1; i < n; i++)
	{
		x = a[i].x; y = a[i].y;
		if (fa[y] == x) adj[x].pb(y);
		else adj[y].pb(x);
	}
	dfs1(1); dfs2(1); prepare(); 
	sf::init(1); sf::dfs3(1);
	it = tmp2 + 2;
	sg::begin(); sg::dfs4(1);
	cout << ans << endl;
	fclose(stdin);
	fclose(stdout);
	return 0;
}

「十二省联考 2019」希望（长链剖分优化dp）

Solution

1.容斥

2.朴素dp

3.长链剖分优化\(f\)

长链剖分优化f-参考程序

4.长链剖分优化g

Code