【洛谷P1939】【模板】矩阵加速(数列)

题目大意:

题目链接:https://www.luogu.org/problemnew/show/P1939
f1=f2=f3=1,fn=fn3+fn1f_1=f_2=f_3=1,f_n=f_{n-3}+f_{n-1}。求fnf_n


前言

这篇博客并不是专门来介绍矩阵乘法加速递推的。
但是既然是模板题就提一下吧。


什么是矩阵乘法?

下面是来自度娘的解释:
在这里插入图片描述

在这里插入图片描述
也就是说,对于两个矩阵AABB,在满足第一个矩阵的列数=第二个矩阵的行数时,这两个矩阵就可以相乘。那么假设AAm×pm imes p的矩阵,BBp×np imes n的矩阵,那么他们相乘得到的矩阵CC就是一个m×nm imes n的矩阵。
而且对于矩阵CC的任意元素ij_{ij},都等于矩阵A第i行的所有数字分别乘上矩阵B第j列的所有数字之和。(其实就是上图的公式)


矩阵乘法和递推的关系?

矩阵乘法和递推关系最密切的例子就是斐波那契数列了。↓
矩阵乘法求斐波那契数列
现在看不懂没关系,可以慢慢理解。
我们知道,斐波那契数列有这样的定义:
fi=fi1+fi2f_i=f_{i-1}+f_{i-2}
那么如果我们有一个2×22 imes 2的矩阵,其中第一行分别是fi1f_{i-1}fi2f_{i-2}。我们的目标是把第一行承上一个矩阵变成fif_ifi1f_{i-1}。那么应该怎么办呢?
在这里插入图片描述

首先,矩阵AA和矩阵CC都含有fi1f_{i-1}这一项。那么就先从这里下手。
我们知道,矩阵CCfi1f_{i-1}在第11行第22列。那么,根据公式,可以得到
C1,2=A1,1×B2,1+A1,2×B2,2C_{1,2}=A_{1,1} imes B_{2,1}+A_{1,2} imes B_{2,2}
也就是说
fi1=fi1×B2,1+fi2×B2,2f_{i-1}=f_{i-1} imes B_{2,1} +f_{i-2} imes B_{2,2}
那么很明显,我们可以得到B2,1=1,B2,2=0B_{2,1}=1,B_{2,2}=0。这样可以保证进行矩阵乘法之后C1,2C_{1,2}fi1f_{i-1}
在这里插入图片描述
那么现在来看矩阵CC中的fif_i。我们要保证的是
C1,1=A1,1×B1,1+A1,2×B2,1C_{1,1}=A_{1,1} imes B_{1,1}+A_{1,2} imes B_{2,1}
也就是说
fi=fi1×B1,1+fi2×B2,1f_{i}=f_{i-1} imes B_{1,1}+f_{i-2} imes B_{2,1}

我们知道,fi=fi1+fi2f_i=f_{i-1}+f_{i-2}。所以可以得到B1,1=1,B2,1=1B_{1,1}=1,B_{2,1}=1
在这里插入图片描述

那么整个矩阵BB都被我们求出来了。
得到了fif_ifi1f_{i-1}后,我们再将它乘一次矩阵BB,就可以得到fi+1f_{i+1}fif_i,又可以得到fi+2f_{i+2}fi+1...f_{i+1}...
这样就可以得到fnf_n了。

但是!

你以为就结束了?
这样的时间复杂度是O(nm2)O(nm^2),其中nn表示求斐波那契数列的第nn项,mm表示矩阵的长宽。还不如递推。而且递推可以得到11nn的所有斐波那契数,而矩阵乘法只能求第nn项。
其实还有个地方可以优化。
我们求fnf_n的时候其实是将原矩阵AA乘了n1n-1次矩阵BB的。也就是说
=A×Bn1目标矩阵=A imes B^{n-1}
看到n1n-1次方想到了什么?
可以用快速幂!
我们用快速幂的思想求出Bn1B^{n-1},然后再乘上一个矩阵AA即可。
怎么用快速幂?
其实是一个道理。只不过把矩阵AA乘矩阵BB换成矩阵BB乘矩阵BB就可以了。
那么最终的时间复杂度为O(m3logn)O(m^3logn)。还是很优秀的。
代码


下面进入正题。


思路:

可以发现矩阵

在这里插入图片描述

然后就是套模板了。。。


代码:

#include <cstdio>
#include <cstring>
#define MOD 1000000007
#define ll long long
using namespace std;

const ll b[4][4]=
{
	{0,0,0,0},
	{0,0,0,1},
	{0,1,0,0},
	{0,0,1,1}
};
int T,n;
ll f[4],a[4][4];


void mul(ll f[4],ll a[4][4])
{
	ll c[4];
	memset(c,0,sizeof(c));
	for (int i=1;i<=3;i++)
	 for (int j=1;j<=3;j++)
	  c[i]=(c[i]+f[j]*a[j][i])%MOD;
	memcpy(f,c,sizeof(c));
}

void mulself(ll a[4][4])
{
	ll c[4][4];
	memset(c,0,sizeof(c));
	for (int i=1;i<=3;i++)
	 for (int j=1;j<=3;j++)
	  for (int k=1;k<=3;k++)
	   c[i][j]=(c[i][j]+a[i][k]*a[k][j])%MOD;
	memcpy(a,c,sizeof(c));
}

void ask(int x)
{
	while (x)
	{
		if (x&1) mul(f,a);
		x>>=1;
		mulself(a);
	}
}

int main()
{
	scanf("%d",&T);
	while (T--)
	{
		scanf("%d",&n);
		if (n<4) 
		{
			printf("1
");
			continue;
		}
		memcpy(a,b,sizeof(b));
		f[1]=f[2]=f[3]=1;
		ask(n-3);
		printf("%lld
",f[3]);
	}
	return 0;
}
原文地址:https://www.cnblogs.com/hello-tomorrow/p/11998472.html