一类SG函数递推性质的深入分析—

一类SG函数递推性质的深入分析——2018ACM陕西邀请赛H题

题目描述

定义一种有根二叉树(T(n))如下：

（1）(T(1))是一条长度为(p)的链；

（2）(T(2))是一条长度为(q)的链；

（3）(T(i))是一棵二叉树，它的左子树是(T(i-2))，右子树是(T(i-1))。

现在给定(p,q,n)，现在Alice和Bob在树(T(n))上玩游戏，每人轮流从树上拿掉一棵子树，直到有一个玩家拿掉根结点所在的子树为止（那么该玩家输了）。现在问先手在第一轮有多少种拿掉子树的方法，可以保证之后自己一定能赢。只用输出答案最后18位即可。

样例：

1 2 5

1 2 10

输出：

数据范围：保证(n,p,q le 2000)。

解题思路

SG函数的求解

该问题等价于不能拿掉总的根，无法操作者输。关于该问题显然应从SG理论入手。下面推导一般树意义下的SG函数。

引理1：设树(T)只有一个儿子，即具有子树(T_1)，则(SG(T)=SG(T_1)+1)。

证明：利用数学归纳法，对树的结点进行归纳。

初始：当(T)只有2个结点时，显然成立。

归纳：设(take(T))为(T)去掉一棵子树后所有可能的树形态的集合。根据SG基本定理， [SG(T)=mex({T' in take(T):SG(T')})] 利用归纳性质， [SG(T)=mex({0} cup {T' in take(T_1):SG(T')+1})=SG(T_1)+1]

证毕。

引理2：设树(T)具有子树(T_1,cdots,T_k)，则(SG(T)=mathop oplus limits_{1 le j le k} (SG({T_j}) + 1))。

证明：对于树(T)的游戏，显然等价于只有子树(T_1,cdots,T_k)的游戏之和，之间互不影响，因为不到最后一步任何人不会拿掉总的树根。根据引理1即得上式。

根据以上引理，本题中便可得出(SG[i]=(SG[i-1]+1)oplus (SG[i-2]+1))，即可在(O(n))时间复杂度求出原问题中每个(T(i)(ile n))的SG值。

转化为动态规划问题

如果原问题问谁赢那么就已经做完了。然而现在问的是第一个人第一步有几种能赢的方案，也就是说有几种拿走子树的方案使得之后SG为0。

考虑动态规划。设(dp[i][j])表示在树(T(i))上玩游戏，先手拿走一棵子树后SG值变为(j-1)的方案数（这里(j-1)是为了后续方便），(dp[i][0])恒定义为1。

初始化：对任意(1le j < p)，(dp[1][j]=1)；对任意(1le j < q)，(dp[2][j]=1)；

转移：对于(i>2)的情形，必然从其中一棵子树中选择拿掉一棵子树。以拿掉左子树中的一棵子树为例：此时右子树SG值不变，为了使之后原树SG变为(j-1)，必须使左子树SG值变为(((j-1)oplus (SG[i-1]+1))-1)。特别地，当((j-1)oplus (SG[i-1]+1))为0时，表示必须拿掉左子树。这样可得转移方程： [dp[i][j]=dp[i-2][(j-1)oplus (SG[i-1]+1)]+dp[i-1][(j-1)oplus (SG[i-2]+1)]] 最终答案为(dp[n][1])。这样我们便在状态数的时间复杂度内解决了本问题。

状态数的分析

问题关键在于确定(dp[i][j])中(j)到底需要计算到多少。考虑所有(SG[i](i le n))中二进制位数的最大值（设为(k)），那么只需计算(j < 2^k)即可。这是因为只要(j < 2^k)，则转移过程中的((j+1) oplus SG[i-1]])以及((j+1) oplus SG[i-2])也必然小于( 2^k)。所以现在关键问题在于计算(SG[i](i le n))中二进制位数的最大值到底是多少。事实上，推导这一问题较为复杂，将留在下一节专门讨论，同时将会得到许多有用的性质。（PS：赛场上我大力猜了一波(SG[i]<2^{13}=8192)，然后就AC了2333）

关于异或递推式

以下以本题中所用递推式为例（令(a[i]=SG[i]+1)变形为(a[i]=(a[i-1]oplus a[i-2])+1)），讨论异或递推式的奇妙性质。

引理3：对任意正整数(k)，(a[i] mod 2^k)具有循环节。

证明：由于(a[i] mod 2^k)只有有限种取值，故必存在(x<y)，使得

[a[x] equiv a[y] mod 2^k,a[x+1] equiv a[y+1] mod 2^k]

那么根据递推式必有（对任意(z>0)）

[a[x+z] equiv a[y+z] mod 2^k]

另一方面，(a[i-2]=a[i-1]oplus (a[i]-1))，故上式对(z<0)也成立。

故(y-x)是循环节。证毕。

引理4：(a[i] mod 2)的循环节必为1或3，且循环节为1时数列是有界的。

证明：只需按a[1]和a[2]的值枚举即可：

情况1：001001......循环节为3；

情况2：010010......循环节为3；

情况3：100100......循环节为3；

情况4：1111111......循环节为1，此时递推式中的+1永远不进位，而(a[4])的高位(=a[3])的高位异或(a[2])的高位(=(a[2])的高位异或(a[1])的高位())异或(a[2])的高位(=a[1])的高位，故最终推出(a[i]=a[i mod 3])。证毕。

定理5：当(a[i] mod 2)的循环节为3时，(a[i] mod 2^k)的循环节为(3 imes 2^{k-1})。

证明：对(k)应用数学归纳法，关键在于考虑低(k-1)位向高位的进位。设想若低(k-1)位不进位，第(k)位循环节必然是1或3（类似引理4）；只有低位进位才会打乱高位的循环节。

基础：(k=2)时，通过枚举(a[1],a[2])模4的余数取值可得所有情况，事实上只有2种：

0232210（进位）23221……循环节为6，中间有1次进位；

00120（进位）30（进位）0（进位）120（进位）3 ……循环节为6，中间有3次进位，且其中两次进位的位置模3余数相同；

归纳：设(a[x]_k)表示(a[x])第(k)位。考虑在位置(x)低(k-1)位向第(k)位有一次进位。这将导致(a[x]_k)取反，进一步导致(a[x+1]_k)取反，(a[x+2]_k)不变，这种取反是3个一循环的。

直到低(k-1)位的下一周期，(a[x+3 imes 2^{k-2}]_k)再次被取反从而不变了，之后(a[x+1+3 imes 2^{k-2}]_k)也不变……这样一来，(a[x])和(a[x+3 imes 2^{k-2}])第(k)位必然不同。进一步地，设(x mod 3=i)，则对于所有(j)，(a[3j+i])和(a[3j+i+3 imes 2^{k-2}])第(k)位必然不同。

对于基础里的两种情况，无论是有一次进位，还是有3次进位但两次位置模3余数相同（从而抵消了），均可以保证(a[3j+i]_k eq a[3j+i+3 imes 2^{k-2}]_k)。从而(a[i] mod 2^k)的循环节为(3 imes 2^{k-1})。

接下来再得到第(k)位向(k+1)位一个循环内的进位情况。由于对于位置(x)和(x+3 imes 2^{k-2})低(k-1)位向第(k)位分别有一次进位，而(a[x]_k)和(a[x+3 imes 2^{k-2}]_k)又不同，故必有且仅有一次使得低(k)位向第(k+1)位进位。因此在一个周期(3 imes 2^{k-1})内，一共向第(k+1)位的进位次数仍满足基础中的两种情况（进位1次或进位3次但有两次位置模3余数相同）。归纳证毕。

根据证明过程立即可得推论6：

推论6：低(k)位在一个周期内最多向第(k+1)位进位3次。

定理7：(a[n]=O(max(n,p,q)))。

证明：设(k)是最小的满足(n < 3 imes 2^k)且(p,q le 2^{k+1})的正整数。那么在前(3 imes 2^k)个数中，低(k+1)位最多进位3次。因此(a[i] < 2^{k+4})。

将(k)用(n,p,q)表达得(2^k le max(p,q,2n/3))，因此(a[i] < 16max(p,q,2n/3))。证毕。

定理7表明了本题所使用算法的时间复杂度为(O(n imes max(n,p,q)))。（然而我不清楚出题人是否也是这么证明的（或者并没有证明直接默认了），如果有更简单的方法请务必联系我！）

PS：感谢Emil Jeřábek对以上的证明提供了巨大的帮助！

总结

在SG理论中，通过打表找出SG的规律是一类常见的题型，然而很多时候证明SG的规律是较为困难的。本文以(a[i]=(a[i-1]oplus a[i-2])+1)为例详细推倒了周期性、上界等结论，这种结论实际上是很有一般性的。许多题目中SG函数均存在异或递推式，从而具有类似的周期性。然而应用SG的上界作为状态进行DP的题目则十分具有创新意义，希望以后可以出现更多的以博弈作为桥梁考察异或性质的题目。

AC代码

 1 #include<cstdio>
 2 #include<cstring>
 3 const long long mod = 1e18;
 4 int sg_1[2001];
 5 long long dp[2001][8192];
 6 int main()
 7 {
 8     int n, p, q;
 9     while (scanf("%d%d%d", &p, &q, &n) == 3){
10         sg_1[1] = p; sg_1[2] = q;
11         for (int i = 3; i <= n; i++)
12             sg_1[i] = (sg_1[i - 2] ^ sg_1[i - 1]) + 1;
13         memset(dp[1], 0, sizeof(dp[1]));
14         memset(dp[2], 0, sizeof(dp[2]));
15         for (int i = 0; i < p; i++)
16             dp[1][i] = 1;
17         for (int i = 0; i < q; i++)
18             dp[2][i] = 1;
19         for (int i = 3; i <= n; i++){
20             dp[i][0] = 1;
21             for (int j = 1; j < 8192; j++)
22                 dp[i][j] = (dp[i - 1][(j - 1) ^ sg_1[i - 2]] + dp[i - 2][(j - 1) ^ sg_1[i - 1]]) % mod;
23         }
24         printf("%lld
", dp[n][1]);
25     }
26 }