浅谈 Miller-Robbin 与 Pollard Rho

前言

$Miller-Robbin$ 与 $Pollard Rho$ 虽然都是随机算法,不过用起来是真的爽。

$Miller Rabin$ 算法是一种高效的质数判断方法。虽然是一种不确定的质数判断法,但是在选择多种底数的情况下,正确率是可以接受的。

$Pollard Rho$ 是一个非常玄学的方式,用于在 $O(n^{1/4})$ 的期望时间复杂度内计算合数$n$的某个非平凡因子。

事实上算法导论给出的是 $O(sqrt p)$ , $p$ 是 $n$ 的某个最小因子,满足 $p$ 与 $frac{n}{p}$ 互质。

但是这些都是期望,未必符合实际。但事实上 $Pollard Rho$ 算法在实际环境中运行的相当不错。

注:以上摘自洛谷。

Miller-Robbin

前置芝士

1. 费马小定理

  • 内容:若 (varphi(p)=p-1,\,p>1),则(a^{p}equiv apmod{p})(a^{p-1}equiv 1pmod{p},\,(a<p))

  • 证明:戳这里

2. 二次探测定理

  • 内容:如果 (varphi(p)=p-1,\,p>1,\,p>X) ,且(X^2equiv 1pmod{p}),那么(X=1 or p-1)

  • 证明:

$ecause$ $X^2equiv 1pmod{p}$

$ herefore$ $p|X^2-1$

$ herefore$ $p|(X+1)(X-1)$

$ecause$ $p$是大于$X$的质数

$ herefore$ $p=X+1 or pequiv X-1pmod{p}$,即$X=1 or p-1$。

算法原理

由费马小定理,我们可以有一个大胆的想法:满足 $a^{p-1}equiv 1pmod{p}$ 的数字 $p$ 是一个质数。

可惜,这样的猜想是错误的,可以举出大量反例,如:$2^{340}equiv 1pmod{341}$,然鹅 $341=31*11$ 。

所以,我们可以取不同的 $a$ 多验证几次,不过,$forall a<561,\,a^{560}equiv 1pmod{561}$,然鹅 $561=51*11$ 。

这时,二次探测就有很大的用途了。结合费马小定理,正确率就相当高了。

这里推荐几个 $a_i$ 的值: $2,3,5,7,11,61,13,17$。用了这几个 $a_i$,就连那个被称为强伪素数的 $46856248255981$ 都能被除去。

主要步骤

  • .将 (p-1) 提取出所有 (2) 的因数,假设有(s) 个。设剩下的部分为 (d)(这里提取所有(2)的因数,是为了下面应用二次探测定理) 。

  • 枚举一个底数 (a_i) 并计算 (x=a_i^{d}pmod p)

  • (y=x^{2}pmod p),如果没有出现过 (p-1),那么 (p) 未通过二次探测,不是质数。

  • 否则,若底数已经足够,则跳出;否则回到第二步。

简易代码

```cpp #define ll long long ll p,a[]={2,3,5,7,11,61,13,17}; inline ll mul(ll a,ll b,ll mod) { ll ans=0; for(ll i=b;i;i>>=1) { if(i&1) ans=(ans+a)%p; a=(a<<1)%p; } return ans%p; } inline ll Pow(ll a,ll b,ll p) { ll ans=1; for(ll i=b;i;i>>=1) { if(i&1) ans=mul(ans,a,p); a=mul(a,a,p); } return ans%p; } bool Miller_Robbin(ll p) { if(p==2) return true; if(p==1 || !(p%2)) return false; ll d=p-1;int s=0; while(!(d&1)) d>>=1,++s; for(int i=0;i<=8 && a[i]Pollard Rho

大致流程

  • 先判断当前数是否是素数(这里就可应用 (Miller-Robbin) ),如果是则直接返回

  • 如果不是素数的话,试图找到当前数的一个因子(可以不是质因子)

  • 递归对该因子和约去这个因子的另一个因子进行分解

如何找因子

一个一个试肯定是不行的。而这个算法的发明者采取了一种清奇的思路。(即采取随机化算法)

  • 我们假设要找的因子为p

  • 随机取一个 (x、y),不断调整 (x) ,具体的办法通常是 (x=x*x+c)(c是随机的,也可以自己定)。

  • (p=gcd(y-x,n)) ,若(p in left(1,n ight)) ,则找到了一个因子,就返回。

  • 如果出现 (x=y) 的循环,就说明出现了循环,并不断在这个环上生成以前生成过一次的数,所以我们必须写点东西来判环:我们可以用倍增的思想,让(y)记住(x)的位置,然后(x)再跑当前跑过次数的一倍的次数。这样不断让(y)记住(x)的位置,x再往下跑,因为倍增所以当(x)跑到(y)时,已经跑完一个圈

  • 同时最开始设定两个执行次数(i=1、k=2)(即倍增的时候用) ,每次取 (gcd)(++i) ;如果 (i==k) ,则令 (y=x) ,并将 (k) 翻倍。

完整代码

#include<cstdio>
#include<ctime>
#include<map>
#include<algorithm>
using namespace std;
#define rg register int
#define V inline void
#define I inline int
#define db double
#define B inline bool
#define ll long long
#define F1(i,a,b) for(rg i=a;i<=b;++i)
#define F3(i,a,b,c) for(rg i=a;i<=b;i+=c)
#define ed putchar('
')
#define bl putchar(' ')
template<typename TP>V read(TP &x)
{
	TP f=1;x=0;register char c=getchar();
	for(;c>'9'||c<'0';c=getchar()) if(c=='-') f=-1;
	for(;c>='0'&&c<='9';c=getchar()) x=(x<<3)+(x<<1)+(c^48);
	x*=f;
}
template<typename TP>V print(TP x)
{
	if(x<0) x=-x,putchar('-');
	if(x>9) print(x/10);
	putchar(x%10+'0');
}
int T;
ll n,ans;
ll a[]={2,3,5,7,11,61,13,17,24251};
template<typename TP>inline ll Gcd(TP a,TP b) {return !b?a:Gcd(b,a%b);}
template<typename TP>inline ll mul(TP a,TP b,TP p)
{
    ll ans=0;
    for(TP i=b;i;i>>=1)
    {
        if(i&1) ans=(ans+a)%p;
        a=(a<<1)%p;
    }
    return ans%p;
}
template<typename TP>inline ll Pow(TP a,TP b,TP p)
{
	ll ans=1;
	for(TP i=b;i;i>>=1)
	{
		if(i&1) ans=mul(ans,a,p);
		a=mul(a,a,p);
	}
	return ans%p;
}
B Miller_Robbin(ll n)
{
	if(n<2) return false;
	if(n==2) return true;
	if(n%2==0) return false;
	ll d=n-1;int s=0;
	while(!(d&1)) d>>=1,++s;
	for(rg i=0;i<=8 && a[i]<n;++i)
	{
		ll x=Pow(a[i],d,n),y=0;
		F1(j,0,s-1)
		{
			y=mul(x,x,n);
			if(y==1 && x!=1 && x!=(n-1)) return false;
			x=y;
		}
		if(y!=1) return false;
	}
	return true;
}
inline ll Pollard_Rho(ll n)
{
	ll x,y,c,i,k;
	while(true)
	{
		ll x=rand()%(n-2)+1;
		ll y=rand()%(n-2)+1;
		ll c=rand()%(n-2)+1;
		i=0,k=1;
		while(++i)
		{
			x=(mul(x,x,n)+c)%n;
			if(x==y) break;
			ll d=Gcd(abs(y-x),n);
			if(d>1) return d;
			if(i==k) {y=x;k<<=1;}
		}
	}
}
V Find(ll n)
{
	if(n==1) return;
	if(Miller_Robbin(n)) {ans=max(ans,n);return;}
	ll p=n;
	while(n<=p) p=Pollard_Rho(p);
	Find(p);Find(n/p);
}
int main()
{
	read(T);srand(time(0));
	while(T--)
	{
		ans=0;
		read(n);Find(n);
		if(ans==n) puts("Prime");
		else print(ans),ed;
	}
	return 0;
}

**emmmm (cdots) **

这数据也太毒瘤了吧!!

看来要疯狂卡常了

优化1(不如叫做卡常?)

蛋定的分析一波,我们发现除了 $Pollard-Rho$ 是 $O(n^{1/4})$ 的期望时间复杂度外, $gcd$ 和龟速乘都是 $O(log N)$ 的。

虽然这种复杂度已经很优秀了,可对于本题的数据((T≤350)(1≤n≤10^{18})),还是太 (cdots)

所以我们要果断摒弃这种很 $low$ 的龟速乘,改用一种暴力溢出的快速乘:

  • 简单原理: (a imes b  mod  p=a imes b−left lfloor frac{a imes b}{p} ight floor)

  • long double 来处理这个 (left lfloor frac{a imes b}{p} ight floor)

  • 然后处理一下浮点误差就可以了。

  • 模数较大时可能会出锅。

  • 不过出锅概率很小 (cdots)

如下

```cpp inline ll mul(ll a,ll b,ll mod) { a%=mod,b%=mod; ll c=(long double)a*b/mod; ll ret=a*b-c*mod; if(ret<0) ret+=mod; else if(ret>=mod) ret-=mod; return ret; } ```

实践证明,战果辉煌:$6pts -> 94pts$ !!!

优化2(正解)

虽然关于龟速乘的 $O(log n)$ 的恶劣影响得到了一定遏制,不过,我还是好想 $AC$ 啊!

通过办法1打表 (cdots)

正确 $AC$ 姿势如下:

- 我们发现在 $Pollard-Rho$ 中如果长时间随机化而得不到结果,$gcd$带来的 $O(log n)$ 还是很伤肾的!!那有没有办法优化呢?答案是肯定的。
  • 在生成(x)的操作中,龟速乘所模的数就是(n),而要求的就是(n)的某一个约数,即现在的模数并不是一个质数

  • 根据取模的性质:如果模数和被模的数都含有一个公约数,那么这次模运算的结果必然也会是这个公约数的倍数。所以如果我们将若干个((y−x)) 相乘,因为模数是 (n) ,所以如果若干个((y−x))中有一个与(n)有公约数,最后的结果定然也会含有这个公约数

  • 所以可以多算几次((y−x))的乘积再来求(gcd) (一般连续算(127)次再求一次(gcd))。

  • 不过(cdots),如果在不断尝试(x)的值时碰上一个环,就可能会还没算到(127)次就跳出这个环了,就无法得出答案;同时,可能(127)次计算之后,所有((y−x))的乘积都变成了(n)的倍数(即(prod_{i=1}^{127} {(y-x)} equiv 0 pmod{n})

  • 所以我们可以不仅在每计算(127)次之后求(gcd)、还要在倍增时(即判环时)求(gcd),这样既维护了其正确性,又判了环!!

  • 完整(AC)代码:

#include<cstdio>
#include<ctime>
#include<algorithm>
using namespace std;
#define rg register int
#define V inline void
#define I inline int
#define db double
#define B inline bool
#define ll long long
#define F1(i,a,b) for(rg i=a;i<=b;++i)
#define F3(i,a,b,c) for(rg i=a;i<=b;i+=c)
#define ed putchar('
')
#define bl putchar(' ')
template<typename TP>V read(TP &x)
{
	TP f=1;x=0;register char c=getchar();
	for(;c>'9'||c<'0';c=getchar()) if(c=='-') f=-1;
	for(;c>='0'&&c<='9';c=getchar()) x=(x<<3)+(x<<1)+(c^48);
	x*=f;
}
template<typename TP>V print(TP x)
{
	if(x<0) x=-x,putchar('-');
	if(x>9) print(x/10);
	putchar(x%10+'0');
}
int T;
ll n,ans;
ll a[]={2,3,5,7,11,61,13,17};
template<typename TP>inline ll Gcd(TP a,TP b) {return !b?a:Gcd(b,a%b);}
inline ll mul(ll a,ll b,ll mod)
{
	a%=mod,b%=mod;
	ll c=(long double)a*b/mod;
	ll ret=a*b-c*mod;
	if(ret<0) ret+=mod;
	else if(ret>=mod) ret-=mod;
	return ret;
}
template<typename TP>inline ll Pow(TP a,TP b,TP p)
{
	ll ans=1;
	for(TP i=b;i;i>>=1)
	{
		if(i&1) ans=mul(ans,a,p);
		a=mul(a,a,p);
	}
	return ans%p;
}
B Miller_Robbin(ll n)
{
	if(n<2) return false;
	if(n==2) return true;
	if(n%2==0) return false;
	ll d=n-1;int s=0;
	while(!(d&1)) d>>=1,++s;
	for(rg i=0;i<=8 && a[i]<n;++i)
	{
		ll x=Pow(a[i],d,n),y=0;
		F1(j,0,s-1)
		{
			y=mul(x,x,n);
			if(y==1 && x!=1 && x!=(n-1)) return false;
			x=y;
		}
		if(y!=1) return false;
	}
	return true;
}
inline ll Pollard_Rho(ll n)
{
	while(true)
	{
		ll x=rand()%(n-2)+1;
		ll y=rand()%(n-2)+1;
		ll c=rand()%(n-2)+1;
		ll i=0,k=1,b=1;
		while(++i)
		{
			x=(mul(x,x,n)+c)%n;
			b=mul(b,abs(y-x),n);
			if(x==y || !b) break;
			if(!(i%127) || i==k)
			{
				ll d=Gcd(b,n);
				if(d>1) return d;
				if(i==k) y=x,k<<=1;
			}
		}
	}
}
V Find(ll n)
{
	if(n<=ans) return;
	if(Miller_Robbin(n)) {ans=max(ans,n);return;}
	ll p=Pollard_Rho(n);
	while(n%p==0) n/=p;
	Find(p),Find(n);
}
int main()
{
	read(T);srand(time(0));
	while(T--)
	{
		ans=0;
		read(n);Find(n);
		if(ans==n) puts("Prime");
		else print(ans),ed;
	}
	return 0;
}
原文地址:https://www.cnblogs.com/p-z-y/p/10603061.html