简述
从某种意义上来说,莫比乌斯反演可以看作是在数论函数上的容斥。当然,它有多种形式,要视具体情况分析。
由于其与狄利克雷卷积息息相关,因此我把它们放在一块写。
前置知识
取整函数的性质
常见的数论函数
关于取值个数的问题(用于证明数论分块的时间复杂度)
证明
若(dlesqrt{n}),则能得到总共不超过(sqrt{n})种结果((d)只有(sqrt{n})种选择);
若(d>sqrt{n}),则因为(lfloor frac{n}{d}
floorlefrac{n}{d}lesqrt{n}),且(lfloor frac{n}{d}
floor)为整数,所以也最多不超过(sqrt{n})种取值;
综上所述,总共不超过(2sqrt{n})种可能取值。
( ext{Dirichlet})卷积
定义
定义两个数论函数(f,g)的( ext{Dirichlet})卷积为:
性质
- ( ext{Dirichlet})卷积满足交换律和结合律。
- (epsilon)为( ext{Dirichlet})卷积的单位元,任何数论函数卷上单位元都为其本身。这很容易说明,因为当且仅当(d=n)时(epsilon(frac{n}{d})=1),其余情况都为0,不被计入。
3 . 若(f,g)均为积性函数,则(h=f*g)也为积性函数。
简证:
[click]
设(n,m)互质:
由于(n,m)互质,其因数也互质,所以所有因数的组合不重不漏地构成了(nm)的因数集合。
常见形式
简证
[click]
由于(varphi)是积性函数,只需证明(k=1)的时候(operatorname{id}=varphi*1)成立即可。设此时(n=p^a)。
由于当(n,m)互质时,其因数除了1无交集,有:
则对于一般情况而言,将(n)按照质因数分解相乘即可证明(operatorname{id}=varphi*1)。
两边同时卷上(mu)即可得到:
(n=1)时,正确性显然。
( ext{Möbius})反演
公式
证明
(1)直接代入
(2)进行卷积
相关练习
[HAOI2011]Problem b
题解
[click]
直接从区间考虑不方便,不妨直接考虑做前缀和和做差,再进行一个容斥。
这时候前面证的性质就要派上用场了。由于(lfloorfrac{n}{x}
floor)的取值一定是连续的,我们可以将相同的值合并到同一块中计数。从前面取整函数的性质可知,使得(lfloorfrac{n}{x}
floor=lfloorfrac{n}{y}
floor)的最大(x=lfloorfrac{n}{lfloorfrac{n}{y}
floor}
floor)。这样就可以根据取值的不同来分块,利用前缀和相减再乘上一个相同的系数来计数。
又由前面所证明的,(lfloorfrac{n}{d}
floor)的取值不超过(2sqrt{n})个,所以一次计数的时间复杂度为(O(sqrt{n}))。
这就是数论分块。
至于容斥,很简单啦,理解成二维前缀和或其它方法都可以。
代码
[click]
#include <cstdio>
#include <cctype>
const int maxn=5e4+10;
int s[maxn],mu[maxn],prim[maxn];
int tot;
bool vis[maxn];
void swap(int &x,int &y) {x^=y^=x^=y;}
int min(int x,int y) {return x<y?x:y;}
int read()
{
int res=0;
char ch=getchar();
while(!isdigit(ch))
ch=getchar();
while(isdigit(ch))
res=res*10+ch-'0',ch=getchar();
return res;
}
void prework(int n)
{
vis[0]=vis[1]=1;
mu[1]=s[1]=1;
for (int i=2;i<=n;i++)
{
if (!vis[i])
prim[++tot]=i,mu[i]=-1;
s[i]=s[i-1]+mu[i];
for (int j=1;j<=tot&&i*prim[j]<=n;j++)
{
vis[i*prim[j]]=1;
if (i%prim[j]==0)
{
mu[i*prim[j]]=0;
break;
}
mu[i*prim[j]]=-mu[i];
}
}
}
int solve(int n,int m)
{
if (n>m)
swap(n, m);
int res=0;
for (int l=1,r=1;l<=n;l=r+1)
{
r=min(n/(n/l), m/(m/l));
res+=(s[r]-s[l-1])*(n/l)*(m/l);
}
return res;
}
int main()
{
int n=read();
prework(5e4);
for (int i=1;i<=n;i++)
{
int a=read(),b=read(),c=read(),d=read(),k=read();
printf("%d
",solve(b/k, d/k)-solve((a-1)/k, d/k)-solve((c-1)/k, b/k)+solve((a-1)/k, (c-1)/k));
}
return 0;
}
[国家集训队]Crash的数字表格
题解
[click]
只需要预处理一下(sum_{i=1}^n i)和(sum_{i=1}^ni^2mu(i)),再进行数论分块,本题就得到了解决。
代码
[click]
#include <cstdio>
#include <cctype>
typedef long long ll;
const int maxn=1e7+10;
const int p=20101009;
int mu[maxn],prim[maxn],s[maxn],t[maxn];
int tot;
bool vis[maxn];
void swap(int &x,int &y) {x^=y^=x^=y;}
int min(int x,int y) {return x<y?x:y;}
int read()
{
int res=0;
char ch=getchar();
while(!isdigit(ch))
ch=getchar();
while(isdigit(ch))
res=res*10+ch-'0',ch=getchar();
return res;
}
void prework(int n)
{
vis[0]=vis[1]=1;
mu[1]=s[1]=1;
for (int i=2;i<=n;i++)
{
if (!vis[i])
prim[++tot]=i,mu[i]=-1;
s[i]=s[i-1]+(ll)i*i*mu[i]%p;
if (s[i]>=p)
s[i]-=p;
else if (s[i]<0)
s[i]+=p;
for (int j=1;j<=tot&&i*prim[j]<=n;j++)
{
vis[i*prim[j]]=1;
if (i%prim[j]==0)
{
mu[i*prim[j]]=0;
break;
}
mu[i*prim[j]]=-mu[i];
}
}
for (int i=1;i<=n;i++)
{
t[i]=t[i-1]+i;
if (t[i]>=p)
t[i]-=p;
else if (t[i]<0)
t[i]+=p;
}
}
int main()
{
int n=read(),m=read();
if (n>m)
swap(n, m);
prework(m);
int ans=0;
for (int d=1;d<=n;d++)
{
int sum=0;
for (int l=1,r=1;l<=n/d;l=r+1)
{
r=min(n/d/(n/d/l), m/d/(m/d/l));
sum+=(ll)(s[r]-s[l-1])*t[n/l/d]%p*t[m/l/d]%p;
if (sum>=p)
sum-=p;
else if (sum<0)
sum+=p;
}
ans+=(ll)sum*d%p;
if (ans>=p)
ans-=p;
else if (ans<0)
ans+=p;
}
printf("%d
",ans);
return 0;
}
[SDOI2015]约数个数和
题解
[click]
首先,(operatorname{d}(ij))当然不可能用(operatorname{d}=1*1)来求。转换思路,(ij)的因数相当于是由(i)因数集合中的元素以及(j)因数集合中的元素相乘而得到的,为了使计数不重不漏,应限制相乘的两个元素互质。
因此得到了(operatorname{d}(ij)=sum_{x|i}sum_{y|j}[gcd(x,y)=1]),有个经常见到的东西就出现了。
代入式子:
代码
[click]
#include <cstdio>
#include <cctype>
typedef long long ll;
const int maxn=5e4+10;
int mu[maxn],prim[maxn];
int tot;
ll s[maxn],t[maxn];
bool vis[maxn];
void swap(int &x,int &y) {x^=y^=x^=y;}
int min(int x,int y) {return x<y?x:y;}
int read()
{
int res=0;
char ch=getchar();
while(!isdigit(ch))
ch=getchar();
while(isdigit(ch))
res=res*10+ch-'0',ch=getchar();
return res;
}
void prework(int n)
{
vis[0]=vis[1]=1;
mu[1]=s[1]=1;
for (int i=2;i<=n;i++)
{
if (!vis[i])
prim[++tot]=i,mu[i]=-1;
s[i]=s[i-1]+mu[i];
for (int j=1;j<=tot&&(ll)i*prim[j]<=n;j++)
{
vis[i*prim[j]]=1;
if (i%prim[j]==0)
{
mu[i*prim[j]]=0;
break;
}
mu[i*prim[j]]=-mu[i];
}
}
for (int i=1;i<=n;i++)
for (int l=1,r=1;l<=i;l=r+1)
{
r=i/(i/l);
t[i]+=(ll)(r-l+1)*(i/l);
}
}
int main()
{
int T=read();
prework(50000);
while(T--)
{
int n=read(),m=read();
if (n>m)
swap(n, m);
ll ans=0;
for (int l=1,r=1;l<=n;l=r+1)
{
r=min(n/(n/l), m/(m/l));
ans+=(s[r]-s[l-1])*t[n/l]*t[m/l];
}
printf("%lld
",ans);
}
return 0;
}
luogu3768 简单的数学题
本题前置知识:杜教筛
题解
[click]
先讲一个稍微麻烦一点的。(不管麻不麻烦最后都是用杜教筛的,你看看这数据范围哪是线性筛能跑得动的)
到这一步你会发现这跟之前有道题非常相似,但是那个数据范围(O(nsqrt{n}))能过而本题不行。所以还要进行下一步转化。
设(t_n=(sum_{i=1}^{n}i)^2=frac{(1+n)^2 n^2}{4})。
(t)很好解决,但是(i^2varphi(i))不数论分块这日子就过不下去了。下面就得用到杜教筛。
设(f(i)=i^2 varphi(i),s(n)=sum_{i=1}^n f(i)),(f)显然为积性函数。根据杜教筛,我们需要找到一个易于计算的(g)使得(h=f*g)也较为好算,通过(g(1)s(n)=sum_{i=1}^n h(i)-sum_{j=2}^n g(j)s(lfloorfrac{n}{j}
floor))即可数论分块求出(s),再套回原式中进行数论分块。
观察(sum_{d|n}d^2varphi(d) g(frac{n}{d}))会觉得这个(d^2)非常的碍眼,想办法将它消成常数再卷(varphi)(我们已经知道了(operatorname{id}=varphi *1),所以这会是一个比较自然的想法)。
不如将(g(x))设为(x^2),恰好能使(h(n)=sum_{d|n}d^2varphi(d) g(frac{n}{d})=n^2sum_{d|n}varphi(d)=n^3)。而(n^3)的和又是可以(O(1))实现的,其表达式可以用拉格朗日插值法等方法得到,最后得到(sum_{i=1}^n h(i)=frac{(1+n)^2n^2}{4}=t(n))。数论分块时还需要用到(sum_{i=1}^n i=frac{n(n+1)(2n+1)}{6})。
于是(s(n)=t(n)-sum_{j=2}^n j^2 s(lfloorfrac{n}{j}
floor)),可以很快地递推出所有取值的(s(lfloorfrac{n}{d}
floor))。又因为(n)在这里和原式中没有变化,所以可以很方便地把(s(lfloorfrac{n}{d}
floor))代回原式中,所需要的值不多不少刚刚好。
具体实现看代码,命名方式与上述相同。
另一种呢,其实本质差不多,只不过变换的角度是从(operatorname{id}=varphi*1)出发的。
接下来要做的,你应该都知道了:想办法对(d^2varphi(d))做杜教筛。
代码就不写了,差不多的,下面放的是上一个做法的代码。
代码
[click]
#include <cstdio>
#include <cctype>
#include <cmath>
#include <map>
using std::map;
typedef long long ll;
const int maxn=1e7+10;
int prim[maxn],s[maxn];
int tot,lim,p;
int inv_4,inv_6;
ll n;
bool vis[maxn];
map<ll,int> S;
ll read()
{
ll res=0;
char ch=getchar();
while(!isdigit(ch))
ch=getchar();
while(isdigit(ch))
res=res*10+ch-'0',ch=getchar();
return res;
}
void prework(int n)
{
vis[0]=vis[1]=1;
s[1]=1;
for (int i=2;i<=n;i++)
{
if (!vis[i])
prim[++tot]=i,s[i]=i-1;
for (int j=1;j<=tot&&(ll)i*prim[j]<=n;j++)
{
vis[i*prim[j]]=1;
if (i%prim[j]==0)
{
s[i*prim[j]]=s[i]*prim[j];
break;
}
s[i*prim[j]]=s[i]*(prim[j]-1);
}
}
for (int i=2;i<=n;i++)
s[i]=((ll)i*i%p*s[i]%p+s[i-1])%p;
}
int power(int a,int n)
{
int res=1;
while(n)
{
if (n&1)
res=(ll)res*a%p;
a=(ll)a*a%p;
n>>=1;
}
return res;
}
int getSquare(ll n) {return n%=p,n*(n+1)%p*(2*n+1)%p*inv_6%p;}
int getCubic(ll n) {return n%=p,(n+1)*(n+1)%p*n%p*n%p*inv_4%p;}
int solve(ll n)
{
if (n<=lim)
return s[n];
else
{
map<ll,int>::iterator it=S.find(n);
if (it!=S.end())
return (*it).second;
}
int res=getCubic(n);
for (ll l=2,r=1;l<=n;l=r+1)
{
r=n/(n/l);
res-=(ll)(getSquare(r)-getSquare(l-1))*solve(n/l)%p;
if (res<0)
res+=p;
else if (res>=p)
res-=p;
}
return S[n]=res;
}
int main()
{
p=read(),n=read();
lim=pow(n, 2.0/3.0);
prework(lim);
int ans=0;
inv_4=power(4, p-2),inv_6=power(6, p-2);
for (ll l=1,r=1;l<=n;l=r+1)
{
r=n/(n/l);
ans+=(ll)getCubic(n/l)*(solve(r)-solve(l-1))%p;
if (ans<0)
ans+=p;
else if (ans>=p)
ans-=p;
}
printf("%d
",ans);
return 0;
}
小结
对于一个式子,要利用狄利克雷卷积的几种常见形式及一些常用的套路(如变换求和顺序、提取公因数等)来达到简化式子进行数论分块的目的。
当数据范围显示线性的时间复杂度无法通过时,考虑杜教筛等低于线性复杂度的方法——也就是说,要善于利用数据范围这一提示信息推测正解时间复杂度。
剩下的大概就是多练习找到推式子的感觉了。
注意小心数据溢出导致的错误。