[NOI Online #3 提高组] 魔法值（矩阵快速幂+各种优化）

矩阵快速幂

相信其他巨佬讲矩阵快速幂的原理和过程都已经很详细了，这里我就着重讲一讲用裸的矩阵快速幂算法之后，如何优化。

优化1：优化矩阵乘法

这个好几位大佬讲过了，我也不讲了，主要就是把 $O(n^3)$ 的矩阵乘法优化到 $O(n^2)$ 。

优化2：倍增预处理矩阵

倍增预处理矩阵的核心思想就是：

将 $2^k$ 个转移矩阵相乘出来的矩阵预处理出来，并记录为 $m_k$ ，那么通过 $m_k=m_{k-1}^2$ 就可以用 $32$ 次矩阵乘法把每个 $m_i$ 算出来。

那么对于一次询问为 $x$ ，也就是求 $2^x$ 个转移矩阵相乘出来的矩阵，我们就可以通过类似倍增一样的算法在 $lo g (x)$ 次计算后计算出答案。

优化3：`bitset`

我们可以发现，在计算矩阵乘法时，可以用 bitset优化。

比如，对于矩阵 $A$ 、 $B$ ，现在要计算 $C = A \times B$ 。

那么根据定义， $C_{i,j}=operatorname{xor}_{k=1}^{n} A_{i,k} imes B_{k,j}$ 。

形象地理解一下， $C_{i,j}$ 的值就是 $A$ 矩阵的第 $i$ 行和 $B$ 矩阵的第 $j$ 列一位一位地乘起来，再把这些乘出来的结果异或起来。

而且我们知道一个性质， $A$ 矩阵和 $B$ 矩阵中只可能出现 $0$ 或 $1$ 。

那么对于两个数 $x, y \in {0, 1}$ ，必定有 $x \times y = x a n d y$ 。

这时容易想到用 bitset维护矩阵乘法。就是把矩阵每一行所代表的 $01$ 串存进 bitset<100>row[100]内，把矩阵的每一列所代表的 $01$ 串存进 bitset<100>line[100]内。然后 $A$ 矩阵的第 $i$ 行和 $B$ 矩阵的第 $j$ 列一位一位地乘起来就是 A.row[i]&B.line[j]，这样我们就能解决乘法的问题了。

但是有一个问题，我们得到了乘出来的序列后，怎么把它们一个一个异或起来呢？注意到这个序列是个 $01$ 序列，那么如果这个序列中 $1$ 的个数为奇数，它们异或起来就是 $1$ ，否则就是 $0$ ，所以异或的部分我们就可以维护了，即 $C_{i,j}=operatorname{count}()mod2$ 。

那么我们就顺利地把 $O(n^3)$ 的矩阵乘法成功优化到 $O(frac{n^3}{64})$ 。（未加优化1）

优化4：询问离线

~~感觉最没用的优化。~~

显然，我们每次询问都算一次 $p o w ()$ ，感觉会重复算了很多，所以不妨把询问给离线存下来，存进数组 $q$ 里面，并对它进行排序。

~~这个排序可能会导致程序变慢而不是变快。~~

那么不妨假设我们现在已经知道了转移矩阵 $t$ 的 $q_i$ 次方是多少，要求 $q_{i+1}$ 的询问，也就是要求出 $t^{q_{i+1}}$ 。那么我们只用求出 $t^{q_{i+1}-q_i}$ ，然后再乘上上次算出来的矩阵，就可以省下一些时间。

~~优化5：O2 优化和 IO 读写~~

最后贴一下代码：（没有加优化1卡过去的）