Luogu6788 「EZEC-3」四月樱花

2020.8.29更新

被命题人@了，原来的做法已经过不去了……

这题是一道很不错的数论题，对整除分块的考察及其时间复杂度分析与优化较为深入。

算法考察

整除分块，常见数论函数性质。

算法分析

我们来推一推柿子。

显然(d(y)=sum_{z|y}1)，因此(y^{d(y)}=prod_{z|y}y)。

我们把(y)拆开：

[prod_{z|y}y=prod_{z|y}z imesprod_{z|y}frac{y}{z}=left(prod_{z|y}z ight)^2=prod_{z|y}z^2 ]

因此原式可推导如下：

[prod_{x=1}^tprod_{y|x}prod_{z|y}frac{z^2}{(z+1)^2} ]

改为枚举(y)

[left(prod_{y=1}^tprod_{z|y}frac{z^2}{(z+1)^2} ight)^{leftlfloorfrac{t}{y} ight floor} ]

改为枚举(z)

[left(prod_{z=1}^tfrac{z^2}{(z+1)^2} ight)^{sum_{y=1}^{leftlfloorfrac{t}{z} ight floor}leftlfloorfrac{t}{yz} ight floor} ]

我们设(f(n)=sum_{i=1}^n leftlfloorfrac{n}{i} ight floor)：

[left(prod_{z=1}^tfrac{z^2}{(z+1)^2} ight)^{fleft(leftlfloorfrac{t}{z} ight floor ight)} ]

整除分块基础——求解(f(n))

考虑(f(n))如何求解。（有整除分块基础的同学可以跳过）

通过观察，我们可以发现(leftlfloorfrac{n}{i} ight floor)最多有(O(sqrt n))种不同的取值，且随(i)增大单调不减。

单调性显然，取值个数简单证明一下：

(ile sqrt n)时，有(sqrt n)个不同的(i)，对应至多(sqrt n)个不同的(leftlfloorfrac{n}{i} ight floor)；
(i>sqrt n)时，发现(leftlfloorfrac{n}{i} ight floor<sqrt n)，因此也至多有(sqrt n)个不同的取值。

因此我们考虑枚举这(sqrt n)种不同的取值即可求解，单次求解的时间复杂度为(O(sqrt n))。

求解(f(n))的代码如下：

int get_f(int n){
	int ret=0;
	for(int l=1,r;l<=n;l=r+1){
		r=n/(n/l);
		// l,r表示区间[l,r]内的整数i，floor(n/i)相等（均为 n/l）
		// l,r 的值的推导本处不展开
		// 可以参考下面相关题目的题解 
		ret=(ret+1ll*(r-l+1)*(n/l))%mod;
		// 区间[l,r]内有(r-l+1)个整数，它们的整除值都是 n/l 
	}
	return ret;
}

整除分块进阶——整除分块嵌套

我们再观察式子：

[left(prod_{z=1}^tfrac{z^2}{(z+1)^2} ight)^{fleft(color{red}{leftlfloorfrac{t}{z} ight floor} ight)} ]

我们发现(f(n))的自变量也出现整除，也就意味着会出现一段连续的(z)，使得(leftlfloorfrac{t}{z} ight floor)的值相同，即(fleft({leftlfloorfrac{t}{z} ight floor} ight))也一定相同。

因此对于指数相同的部分，我们只需要知道底数的部分积即可。

观察底数部分的部分积。

[prod_{z=l}^rfrac{z^2}{(z+1)^2}=frac{l^2}{(r+1)^2} ]

发现这个值可以配合费马小定理求逆元快速求出。

类比整除分块的过程，我们枚举(O(sqrt t))个不同的(leftlfloorfrac{t}{z} ight floor)的值，指数部分可以用整除分块求解。

这就是整除分块套整除分块。

类比杜教筛，时间复杂度为(O(t^{frac{3}{4}}log t))，前面是整除分块套整除分块的复杂度，即(sum_{i=1}^{sqrt t}O(sqrt i)+O(sqrt{frac{n}{i}})=O(t^{frac{3}{4}}))，后面(log t)是过程中求逆元。

算法优化

本算法还有进一步优化的空间。

继续类比杜教筛。在杜教筛中，我们预处理出部分函数值及其前缀和，从而将时间复杂度由(O(n^frac{3}{4}))优化到(O(n^frac{2}{3}))。对于本题，我们能不能也预处理出一部分(f(n))，从而优化时间复杂度呢？

因数与倍数——(f(n))求法优化

我们考虑(leftlfloorfrac{a}{b} ight floor)的实际含义，其可以表示不超过(a)的数中有多少个是(b)的倍数，即(sum_{i=1}^a [b|i])。

因此我们把(f(n))改写如下：

[f(n)=sum_{i=1}^n leftlfloorfrac{n}{i} ight floor ]

[=sum_{i=1}^n sum_{j=1}^n [i|j] ]

[=sum_{j=1}^n sum_{i=1}^n [i|j] ]

[=sum_{j=1}^n sum_{i|j}1 ]

[=sum_{j=1}^n sigma(j) ]

其中(sigma(n))表示(n)有多少个因数。

根据(sigma(n))的定义，我们不难写出单次询问(O(sqrt n))的算法求出单个(sigma(n))，但这个显然不能满足我们的需求。

现在我们考虑如何批量求出(sigma(n))。

注意到对每一个数(i)，都会对(i)的倍数产生(1)的贡献，因此我们再次枚举倍数，即可批量求出(sigma(n))，最后求一遍前缀和即可批量求出(f(n))。

具体实现如下：

for(int i=1;i<=N;i++){
	for(int j=1;i*j<=N;j++){
		sig[i*j]++;
	}
}

时间复杂度为(sum_{i=1}^nfrac{n}{i}=O(nlog n))，可用调和级数证明。

上述过程也可以用狄利克雷卷积解释，即(1 * 1)，而求狄利克雷卷积的通用方法正是枚举倍数。

我们也不难看出(sigma(n))是一个积性函数，并且(sigma(p^k)=k+1)，这意味着我们可以线性筛批量求出(sigma(n))，时间复杂度为(O(n))。

代码实现

注意(2.5 imes10^9)超出了 int 范围，要使用unsigned int；
注意对指数上的整除分块求和模数应为(varphi(p)=p-1)；
注意常数优化。

#include<bits/stdc++.h>
using namespace std;
#define maxn 1000005
#define ui unsigned
template <typename Tp> void read(Tp &x){
	int fh=1;char c=getchar();x=0;
	while(c>'9'||c<'0'){if(c=='-'){fh=-1;}c=getchar();}
	while(c>='0'&&c<='9'){x=(x<<1)+(x<<3)+(c&15);c=getchar();}x*=fh;
}
ui n,mod;
ui ans=1;
ui ksm(ui B,ui P){ui ret=1;while(P){if(P&1)ret=1llu*ret*B%mod;B=1llu*B*B%mod;P>>=1;}return ret;}
ui f[maxn];
ui calc(ui x){//整除分块求f(n) 
	if(x<=1000000)return f[x];
	ui ret=0;
	for(ui l=1,r;l<=x;l=r+1){
		r=x/(x/l);
		ret=(ret+1ll*(r-l+1)*(x/l))%(mod-1);
	}
	return ret;
}
void preprocess(int N){//预处理求f(n) 
	for(int i=1;i<=N;i++){
		for(int j=1;i*j<=N;j++){
			f[i*j]++;
		}
	}
	for(int i=1;i<=N;i++)f[i]=(f[i-1]+f[i])%mod;
}
signed main(){
	read(n);read(mod);
	preprocess(1000000);
	for(ui l=1,r;l<=n;l=r+1){
		r=n/(n/l);//整除分块嵌套 
		ui invr=1llu*l*ksm((r+1)%mod,mod-2)%mod;
		invr=1llu*invr*invr%mod;
		ans=1llu*ans*ksm(invr,calc(n/l))%mod;
	}
	printf("%u
",ans);
	return 0;
}

后记

本题解中附有一些相关题目，其本身可能难度不是很大，但其思想与本题相同。

对于求解不同的数论问题，枚举因数与枚举倍数各有所长，有时可能要反复转化。