素数筛法

之前在解释求素数的一道习题时，提过一个方法，叫素数筛法。下面就对这种方法的过程进行详细的解读。

之前提到

假设所有待判断的数字的上限是L，声明一个长度为L＋1的布尔数组A[L＋1]。用这个数组来表示对应下标的数字是不是素数。起初，将数组所有成员标记为1，然后按照某种方法将其中的非素数都标记为0即可，完成后的数组有这样的特征：所有素数为下标的成员内存的数字都是1，所有非素数为下标的成员内存的数字都是0。例如：2 是素数，那么A[2]＝1；4不是素数，那么A[4]＝0。这样，判断一个数是不是素数，直接查找即可。

这个标记的方法是这样的：1不是质数，也不是合数，标记0。第二个数2是质数标记为1，而把2后面所有能被2整除的数都标记为0。2后面第一个没划去的数是3，把3标记为1，再把3后面所有能被3整除的数都标记为0。3后面第一个没划去的数是5，把5标记为1，再把5后面所有能被5整除的数都标记为0。这样一直做下去，就会把不超过N的全部合数都标记为0，留下的就是不超过N的全部质数。因为希腊人是把数写在涂腊的板上，每要划去一个数，就在上面记以小点，寻求质数的工作完毕后，这许多小点就像一个筛子，所以就把埃拉托斯特尼的方法叫做“埃拉托斯特尼筛法”，简称“筛法”。

当然这个方法会有重复筛掉某一合数的现象，例如，删3的倍数时15标记为0，删15的倍数时，同样再一次将15标记为0。这还不够精简，因此有人将这个方法进行了改进：

首先初始A［1］＝0，A［2］＝1；

其次，将所有偶数下标的成员全部置为0，

接下来求出 t＝√A

接下来从i＝3开始到i＝t开始当A［i］＝1时进行下列操作

｛

从 j＝i＊i 开始，到 j＝L 结束，每次 j 加 2＊i 让A［j］＝0

｝

以上的改进主要是从减少重复判断次数这个方向来进行改进的。

改进的原理如下：

1⃣️首先，将1 和 2 进行初始，1 为非素数，A［1］＝ 0， 2 为素数，A［2］＝ 1。

2⃣️所有的偶数都是2的倍数，也就意味着，所有的偶数都能被2整除，因此所有偶数不是素数。那么将所有偶数下标的成员赋值为0是合理的。这就将素数的范围缩小为奇数。

3⃣️为什么 i 从3 开始到 t 便可以结束呢？原因是循环之内（黄色字体）的 j 每次是以 i ＊ i 为初始值进行判断的，如果 i > t ，那么 i ＊ i 一定大于 L，所以就没必要进行 t 之后的循环了。只判断 A［ i ］＝ 1（即 A［ i ］是奇数）的情况，原因是循环之内的处理，实际上处理的是 i 的倍数是不是素数的问题，大家都清楚，不仅 2 的所有倍数是偶数，所有偶数的倍数都是偶数。

4⃣️现在解释循环之内（黄色字体）的内容，有人很好奇，为什么不用考虑 i ＊3 到 i ＊（ i－1）之间的数呢，那么假设有一个数 p 介于 3 和（ i － 1）之间，显然，如果 i ＊ p 是小于 L 范围之内的数，在 i ＝ p 的时候，就应该判断过这个数了。

j ＝ i ＊ i 是非素数，这个就很明显了。

至于为什么 j 每次的增量是 2 ＊ i ，而不是 i 呢？因为奇数个奇数相加一定是奇数，偶数个奇数相加一定是偶数。首先 i 是奇数，那么 i 个i 相加就可以表示为 i ＊ i，如果增量是 i 且 i ＊ i 是奇数的话，i ＊ i ＋i 必定是偶数， i＊i＋2i 才是奇数，也就说增量是 i 的时候，每两次循环中，有一次就判断偶数（偶数之前已经被排除过了），这样岂不是违背了要提高效率的初衷？因此，在当前循环中需要处理的只是奇数且是非素数的情况。j ＝i ＊ i＋2i＝i ＊（ i ＋ 2）显然也是非素数，以此类推 j ＝ j ＋2*i 是非素数，直至该数超过上限结束本次循环。

这样就保证万无一失且不重复的排除所有情况啦。

初看这个方法，觉得好奇怪，仔细品味，回味无穷。

我的微信公众号为“昵昵的宝典”，欢迎大家关注了解最新的内容。