[hdu5901]Count primes

最简单的是利用Min25筛求$h(n)$的过程,即

 1 #include<bits/stdc++.h>
 2 using namespace std;
 3 #define N 1000005
 4 #define ll long long
 5 int K,vis[N],P[N],h[N<<1];
 6 ll n;
 7 int id(ll k){
 8     if (k<=K)return k;
 9     return 2*K+1-n/k;
10 }
11 ll get(int k){
12     if (k<=K)return k;
13     return n/(2*K+1-k);
14 }
15 void init(int K){
16     for(int i=2;i<=K;i++){
17         if (!vis[i])P[++P[0]]=i;
18         for(int j=1;(j<=P[0])&&(i*P[j]<=K);j++){
19             vis[i*P[j]]=1;
20             if (i%P[j]==0)break;
21         }
22     }
23 }
24 int main(){
25     init(N-5);
26     while (scanf("%lld",&n)!=EOF){
27         K=(int)sqrt(n);
28         for(int i=1;i<=2*K;i++)h[i]=get(i);
29         for(int i=1;P[i]<=K;i++)
30             for(int j=2*K;(j)&&(1LL*P[i]*P[i]<=get(j));j--)h[j]-=h[id(get(j)/P[i])]-h[id(P[i]-1)];
31         printf("%lld
",h[id(n)]-1);
32     }
33 } 
View Code

事实上,还可以进一步优化

定义$Min(i)$为$i$的最小素因子(特别的,$Min(1)=infty$),$Max(i)$为$i$的最大素因子,$p_{i}$为从小到大第$i$个素数,$pi_{k}(n)=sum_{p_{i}le n}p_{i}^{k}$(本题中$k=0$,但由于$k$并不影响下述算法,因此以下设$k$为较小的常数)

记$cnt(x)$为$x$的可重素因子个数,具体来说,满足:

1.$cnt(1)=0$,$forall p_{i},cnt(p_{i})=1$

2.$forall x,y>0,cnt(xy)=cnt(x)+cnt(y)$

选择一个素数$p_{B}$,满足$p_{B}^{3}ge N$且$p_{B}^{2}le N$,关于$P_{B}$最为合适的值以后再分析

定义$phi_{s}(n,m)=sum_{1le ile n,p_{m}<Min(i),cnt(i)=s}i^{k}$,$phi(n,m)=sum_{s}phi_{s}(n,m)$

当$p_{m+1}^{s}>n$时有$phi_{s}(n,m)=0$,因此,不难得到有$phi(N,B)=sum_{s=0}^{2}phi_{s}(N,B)$,分别考虑这三项,又有
$$
phi(N,B)=1+(pi_{k}(N)-pi_{k}(P_{B}))+phi_{2}(N,B)
$$
简单移项,又有
$$
pi_{k}(N)=pi_{k}(P_{B})-phi_{2}(N,B)+phi(N,B)-1
$$
关于$pi_{k}(P_{B})$可以$o(P_{B})$的求出,$phi_{2}(N,B)$不妨暴力枚举具体的两个素数,即
$$
phi_{2}(N,B)=sum_{B<ile j,p_{i}p_{j}le N}(p_{i}p_{j})^{k}=sum_{B<i}p_{i}^{k}sum_{ile j,p_{i}cdot p_{j}le N}p_{j}^{k}
$$
由于$i>B$,后者即$pi_{k}$的前缀和差分,用$o(frac{N}{P_{B}})$的复杂度预处理,同时$p_{i}^{2}le N$,关于$i$的枚举即$o(sqrt{N})$

$phi(n,m)$的计算-递推

类似前面关于$phi(n,m)$的计算,不难得到$phi(n,m)=phi(n,m-1)-p_{m}^{k}phi(lfloorfrac{n}{p_{m}} floor,m-1)$

考虑递归计算,那么就构成了一棵满二叉树,更具体的,有:

1.用二元组表示一个节点,通常记作$(x,h)$($hge 0$),根为$(1,m)$,且边有边权

2.对于$(x,h)$的状态,分类讨论——

(1)若$h=0$,则$(x,h)$的为叶子;

(2)若$h>0$,则$(x,h)$的左儿子为$(x,h-1)$,边权为1,右儿子为$(xcdot p_{h},h-1)$,边权为$-p_{h}^{k}$

定义$(x,h)$的权值为其到根路径上所有边边权乘积$ imes phi(lfloorfrac{n}{x} floor,h)$,根据$phi$的递推式,一个点的权值即为其两个儿子的权值和(都乘了一个$x$到根的系数)

根据这个,我们只需要选择若干个节点,使得每一个叶子到根路径上恰有一个节点被选择,那么不难证明根节点的权值即为所有选择的节点权值和

下面,我们构造一种选择方式,并简单证明一下这样选择的正确性——

选择$(x,h)$当且仅当$h=0$且$xle p_{B}$,或$p_{B}<xle p_{B}cdot Min(x)$且$p_{h+1}=Min(x)$

根据前面,也就是要求叶子到根的路径恰好存在一个节点被选择

从构造树的过程,可以发现:对于一个非根节点$(x,h)$,若$p_{h+1}=Min(x)$则其父亲为$(frac{x}{Min(x)},h+1)$,否则为$(x,h+1)$

1.对于$(x,0)$(其中$xle p_{B}$),首先其必然直接被选择,同时对于其到祖先的链上节点权值必然因此不大于$x$即不大于$p_{B}$,不可能有其余点被选

2.对于$(x,0)$(其中$x>p_{B}$),不断向上找到其中第一个节点$y$使得$y$的父亲不超过$p_{B}$,由于$y$的父亲要比$y$小(否则$y$的儿子也可以),那么$y$的父亲即$frac{y}{Min(y)}$,那么$p_{h+1}=Min(y)$

同时,$y$自己是可以的,因此就得到了$p_{B}<yle p_{B}cdot Min(y)$

对于这个右儿子的父亲以上的节点与第一点相同,都不超过$p_{B}$,右儿子以下的节点中分类讨论:

(1)若等于$y$,那么$h$减小,不满足$p_{h+1}=Min(y)$

(2)若不等于$y$(大于),记作$z$,来考虑第一个比其小的祖先,其权值不小于$y$(否则可以选$y$),不难证明这个节点就是$frac{z}{Min(z)}ge y>p_{B}$,不符合条件

接下来,考虑一个$x$所对应的系数:首先,每一次乘上素数$p$都有一个$p^{k}$,总共即为$x^{k}$,符号取决于素因子个数,恰好是$mu(x)$

另外还有$x$的条件,在上面的基础上,我们还需要保证$(x,h)$这个节点会出现,即$Max(x)le p_{m}$以及$x$中不含有素数平方的因子,后者由于$mu(x)$恰好为0,可以不判定

更具体的,有下式
$$
phi(n,m)=sum_{1le xle p_{B},Max(x)le p_{m}}mu(x)x^{k}phi(lfloorfrac{n}{x} floor,0)+sum_{p_{B}<xle p_{B}cdot Min(x),Max(x)le p_{m}}mu(x)x^{k}phi(lfloorfrac{n}{x} floor,pi(Min(x))-1)
$$

$phi(n,m)$的计算-分类

关于$phi(n,0)=sum_{i=1}^{n}i^{k}$不难推导出通项公式,因此前者可以$o(p_{B})$计算

进一步的,将后者拆分,先枚举$p_{m'}=Min(x)$,即
$$
-sum_{m'=1}^{m}p_{m'}^{k}sum_{xle p_{B}<xcdot p_{m'},Min(x)>p_{m'},Max(x)le p_{m}}mu(x)x^{k}phi(lfloorfrac{n}{xcdot p_{m'}} floor,m'-1)
$$
具体代入,所求的是$phi(N,B)$,即
$$
-sum_{m'=1}^{B}p_{m'}^{k}sum_{xle p_{B}<xcdot p_{m'},Min(x)>p_{m'}}mu(x)x^{k}phi(lfloorfrac{N}{xcdot p_{m'}} floor,m'-1)
$$
分为三类来计算——

1.当$p_{m'}^{2}le p_{B}$,此时对于后面的状态,由于$lfloorfrac{n}{xcdot p_{m'}} floorin S_{n}$,可以在$o(frac{sqrt{p_{B}N}}{log n})$的时间内预处理出来(根据$phi(n,m)=phi(n,m-1)-p_{m}^{k}phi(lfloorfrac{n}{p_{m}} floor,m-1)$来计算)

再以$o(frac{p_{B}sqrt{p_{B}}}{log p_{B}})$的复杂度枚举$m'$和$x$,总复杂度即为$o(frac{sqrt{p_{B}N}}{log N})$(枚举$m'$和$x$的复杂度较小)

2.当$p_{m'}^{2}>p_{B}$,此时考虑$xle p_{B}$且$Min(x)>p_{m'}$,不难发现$cnt(x)<2$,即$x$为素数或是1,后者显然不满足$p_{B}<xcdot p_{m'}$,因此$x$为素数

接下来,原式即
$$
sum_{m'le B,p_{m'}^{2}> p_{B}}p_{m'}^{k}sum_{x=m'+1}^{B}p_{x}^{k}phi(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)
$$
$phi(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)=sum_{s}phi_{s}(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)$,又有当$lfloorfrac{N}{p_{x}cdot p_{m'}} floor<p^{s}_{m'}$时为0,那么考虑令$s$只能为0来缩小$p_{m'}$的范围,即$p_{x}cdot p_{m'}^{2}>N$,又因为$p_{x}>p_{m'}$,放缩为$p_{m'}^{3}>N$

此时该式即为$phi_{0}(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)=[Nge p_{x}cdot p_{m'}]$,又因为$p_{B}^{2}le N$,恒为1,即
$$
sum_{m'le B,p_{m'}^{3}>N}p_{m'}^{k}sum_{m'<xle B}p_{x}^{k}
$$
对$m'$用$o(B)$枚举,后面即一个$pi_{k}$的前缀和差分,预处理即可,总复杂度为$o(B)$

3.$p_{m'}^{2}>p_{B}$且$p_{m'}^{3}le N$,仍然有$x$为素数,与第二部分的第一个式子相同,即
$$
sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}le N}p_{m'}^{k}sum_{m'<xle B}p_{x}^{k}phi(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)
$$
这一类比较难算,回顾$phi(lfloorfrac{N}{p_{x}cdot p_{m'}} floor,m'-1)$的定义,由于$cnt(x)$是任意的,即在$phi_{s}(n,m)$的基础上去掉$s$的限制即可,将其代入即
$$
sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}le N}p_{m'}^{k}sum_{x=m'+1}^{B}p_{x}^{k}sum_{qcdot p_{x}cdot p_{m'}le N,Min(q)ge p_{m'}}q^{k}
$$
调换$x$和$q$的枚举顺序,即
$$
sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}le N}p_{m'}^{k}sum_{qcdot p_{m'}^{2}le N,Min(q)ge p_{m'}}q^{k}sum_{m'<xle B,qcdot p_{x}cdot p_{m'}le N}p_{x}^{k}
$$
关于这件事情的计算方式:

先枚举$m'$,之后对$lfloorfrac{N}{p_{m'}} floor$数论分块,通过$m'$和$lfloorfrac{N}{qcdot p_{m'}} floor$显然可以确定$x$这一维度的和($o(B)$预处理),接下来也就是求区间内有多少给$q$满足$Min(q)ge p_{m'}$

由于$p_{m'}^{2}>p_{B}$,即$qcdot p_{B}le N$,可以预处理出每一个$q$的$Min(q)$,并从大到小枚举$m'$,加入对应的$q$,再用树状数组来维护即可

时间复杂度上,对$m'$的枚举是$o(frac{N^{frac{1}{3}}}{log N})$,接下来数论分块是$sqrt{frac{N}{p_{m'}}}$,将其求和即
$$
sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}le N}sqrt{frac{N}{p_{m'}}}=sqrt{N}sum_{1le i^{3}le N}(pi(i)-pi(i-1))i^{-frac{1}{2}}
$$
根据素数定理,即$pi(n)=o(frac{n}{log n})$,代入后即为
$$
frac{sqrt{N}}{log N}sum_{1le ile N^{frac{1}{3}}}i^{-frac{1}{2}}=frac{sqrt{N}}{log N}int_{1}^{N^{frac{1}{3}}}i^{-frac{1}{2}}=frac{N^{frac{2}{3}}}{log N}
$$
之后还有一个树状数组,总复杂度为$o(N^{frac{2}{3}})$,理论上优于$o(frac{N^{frac{3}{4}}}{log N})$

同时,对于其修改总复杂度为$o(frac{Nlog N}{p_{B}})$,这取决于需要插入的$q$数量

$phi(n,m)$的计算-优化

发现复杂度的瓶颈在于第三部分,考虑再对$q$分类讨论:

1.若$q=1$,即为
$$
sum_{p_{m'}^{2}>p_{B},p_{m'}^{3}le N}p_{m'}^{k}sum_{m'<xle B}p_{x}^{k}
$$
随便维护一下,复杂度为$o(frac{N^{frac{1}{3}}}{log N})$

2.若$q$是素数,则即要求$qge p_{m'}$,这个就不需要用树状数组维护,即$o(frac{N^{frac{2}{3}}}{log N})$

3.若$q$不是素数,即$qge Min(q)^{2}ge p_{m'}^{2}$,即$p_{m'}^{4}le N$,此时询问复杂度类似于前面是$o(N^{frac{5}{8}})$

对于修改的复杂度,事实上是$o(frac{N}{p_{B}})$的,以下来证明:

首先,有这样一个性质$forall sge 1,sum_{i=1}^{n}[cnt(i)=s]=o(frac{n}{log n})$

证明考虑归纳,$s=1$即素数定理,$s>1$时有
$$
sum_{i=1}^{n}[cnt(i)=s]=sum_{p_{i}le n}sum_{1le jle lfloorfrac{n}{p_{i}} floor}[cnt(j)=s-1]=frac{sum_{p_{i}le n}{lfloorfrac{n}{p_{i}}} floor}{log n}
$$
对于分子简单来看,就是调和级数*素数的概率,后者根据素数定理即$o(frac{1}{log n})$,总共即$o(n)$(更精确的来说是埃氏筛的复杂度,即为$o(nloglog n)$,这里就简单看作$o(n)$了)

那么即证明了对于$s>1$,对应的个数也是$o(frac{n}{log n})$的

事实上,这件事情的正确理解方式应该是对于任意$s$,总存在足够大的$n$,使得此时$cnt(i)=s$的数量大约为$o(frac{n}{log n})$的的级别

考虑$p_{B}^{3}ge N$,且$Min(q)^{2}ge p_{m'}^{2}>p_{B}$,有$Min(q)^{6}ge N$,因此$cnt(q)le 6$,数量为$o(frac{N}{p_{B}log N})$(由于$N$并不足够大,这里的范围实际更接近$o(frac{N}{p_{B}})$),算上树状数组后即$o(frac{N}{p_{B}})$

时间复杂度

综合上述,复杂度包含——

0.线性筛,$o(frac{N}{p_{B}})$预处理出素数(个数)、$mu(i)$、$pi_{k}(i)$、$Min(i)$和$Max(i)$($icdot p_{B}le N$)

1.$o(1)$求出$pi_{k}(p_{B})$

2.$o(sqrt{N})$求出$phi_{2}(N,B)$

3.$o(frac{sqrt{p_{B}N}}{log N})$求出$phi(N,B)$的第一部分

4.$o(B)$求出$phi(N,B)$的第二部分

5.$o(frac{N^{frac{2}{3}}}{log N}+N^{frac{5}{8}}+frac{N}{p_{B}})$求出$phi(N,B)$的第三部分

关于$p_{B}$的取值考虑$o(frac{sqrt{p_{B}N}}{log N})$和$o(frac{N}{p_{B}})$,相等即解出$p_{B}=N^{frac{1}{3}}log^{frac{2}{3}}N$,总时间复杂度为$o((frac{N}{log N})^{frac{2}{3}})$

空间复杂度与时间复杂度相同,也为$o((frac{N}{log N})^{frac{2}{3}})$,劣于$o(sqrt{N})$的空间复杂度

具体实现中,这个算法的时间相比$o(frac{N^{frac{3}{4}}}{log N})$的算法有较大的改善,但会被卡空间

  1 #include<bits/stdc++.h>
  2 using namespace std;
  3 #define N 3000005
  4 #define ll long long
  5 vector<int>v[N];
  6 int K,B,P[N],vis[N],pi[N],mu[N],Min[N],Max[N],f[N];
  7 ll n,ans,h[N];
  8 ll sqr(int k){
  9     return 1LL*k*k;
 10 }
 11 ll cube(int k){
 12     return 1LL*k*k*k;
 13 }
 14 int id(ll k){
 15     if (k<=K)return k;
 16     return 2*K+1-n/k;
 17 }
 18 ll get(int k){
 19     if (k<=K)return k;
 20     return n/(2*K+1-k);
 21 }
 22 void init(int K){
 23     mu[1]=1;
 24     for(int i=2;i<=K;i++){
 25         pi[i]=pi[i-1];
 26         if (!vis[i]){
 27             P[++P[0]]=i;
 28             mu[i]=-1;
 29             pi[i]++;
 30             Min[i]=Max[i]=i;
 31         }
 32         for(int j=1;(j<=P[0])&&(i*P[j]<=K);j++){
 33             vis[i*P[j]]=1;
 34             Min[i*P[j]]=P[j];
 35             Max[i*P[j]]=Max[i];
 36             if (i%P[j])mu[i*P[j]]=-mu[i];
 37             else{
 38                 mu[i*P[j]]=0;
 39                 break;
 40             }
 41         }
 42     }
 43 }
 44 int lowbit(int k){
 45     return (k&(-k));
 46 }
 47 void update(int k){
 48     while (1LL*k*P[B]<=n){
 49         f[k]++;
 50         k+=lowbit(k);
 51     }
 52 }
 53 int query(int k){
 54     int ans=0;
 55     while (k>0){
 56         ans+=f[k];
 57         k-=lowbit(k);
 58     }
 59     return ans;
 60 }
 61 int query(int l,int r){
 62     return query(r)-query(l-1);
 63 }
 64 int main(){
 65     init(N-5);
 66     while (scanf("%lld",&n)!=EOF){
 67         K=3e6;
 68         if (n<=K){
 69             printf("%d
",pi[n]);
 70             continue;
 71         } 
 72         int pB=(int)pow(n*pow(log(n),2),1.0/3);
 73         for(int i=1;i<=P[0];i++)
 74             if (P[i]>=pB){
 75                 B=i;
 76                 break;
 77             }
 78         ans=pi[P[B]]-1;
 79         for(int i=B+1,j=P[0];sqr(P[i])<=n;i++){
 80             while (1LL*P[i]*P[j]>n)j--;
 81             ans-=pi[P[j]]-pi[P[i]-1];
 82         }
 83         for(int i=1;i<=P[B];i++)ans+=mu[i]*(n/i);
 84         K=(int)sqrt(n);
 85         for(int i=1;i<=2*K;i++)h[i]=get(i);
 86         for(int i=1;sqr(P[i])<=P[B];i++){
 87             for(int j=1;j<=P[B];j++)
 88                 if ((P[B]<1LL*j*P[i])&&(Min[j]>P[i]))ans-=mu[j]*h[id(n/P[i]/j)];
 89             for(int j=2*K;j;j--)h[j]-=h[id(get(j)/P[i])];
 90         }
 91         for(int i=B;cube(P[i])>n;i--)ans+=pi[P[B]]-pi[P[i]];
 92         int l=0,r=0;
 93         for(int i=1;i<=B;i++){
 94             if ((!l)&&(sqr(P[i])>P[B]))l=i;
 95             if (cube(P[i])<=n)r=i;
 96         }
 97         for(int i=l;i<=r;i++)ans+=B-i;
 98         for(int i=l;i<=r;i++){
 99             ll nn=n/P[i];
100             for(ll x=P[i],y;P[i]<nn/x;x=y+1){
101                 y=nn/(nn/x);
102                 ans+=1LL*(pi[y]-pi[x-1])*(pi[min(nn/x,(ll)P[B])]-pi[P[i]]);
103             }
104         }
105         memset(f,0,sizeof(f));
106         for(int i=1;i<=B;i++)
107             if (sqr(sqr(P[i]))<=n)r=i;
108         for(int i=1;i<=P[0];i++)v[P[i]].clear();
109         for(int i=1;1LL*i*P[B]<=n;i++)
110             if (vis[i]){
111                 if (Min[i]>P[r])update(i);
112                 else v[Min[i]].push_back(i);
113             }
114         for(int i=r;i>=l;i--){
115             for(int j=0;j<v[P[i]].size();j++)update(v[P[i]][j]);
116             ll nn=n/P[i];
117             for(ll x=1,y;P[i]<nn/x;x=y+1){
118                 y=nn/(nn/x);
119                 ans+=1LL*query(x,y)*(pi[min(nn/x,(ll)P[B])]-pi[P[i]]);
120             }
121         }
122         printf("%lld
",ans);
123     }
124 }
View Code
原文地址:https://www.cnblogs.com/PYWBKTDA/p/14393626.html