1、1 集合筛法与素数三大猜想的证明 陕西神木 史明智 集合筛法 一般认为,用来制造素数表的厄拉多塞筛法在理论上是没有用处的。这种 筛法虽然可以准确无误、一个不漏地找出不大于 N 的每个素数,却无法运用它 来推理和证明更为深刻的问题。因为在不大于 N 的自然数集合中,任意一个不 大于 的素数 P 的倍数之个数为 ,就是这个取整程序阻碍了推理和计Ni iP 算的顺利进行。 但是,这不等于说厄氏筛法所涉及的自然数、素数、合数相互关系的规律 就无法进一步发掘和利用。本文试图在推理过程中突破整数限制来探究它们之 间的规律,即将 视为 去推理,推理和计算过程不考虑取整,只对最终iPNi 结果四舍五入保留整数
2、。对于由此产生的误差,在利用得出的规律解决实际问 题时,根据问题本身对准确程度的要求再作具体分析处理。 把 视为 ,就可以这样表述:不大于 N 的自然数集合中,有 的元ii iP1 素是 P 的倍数,也即自然数集合元素数分别与其中 P 的倍数集合元素数之比i i 为 1: 。 我们来证明如下定理。i 定理:在不大于 N 的自然数集合中,每次筛去不大于 的一个素数的倍N 数集合,每次筛剩的自然数个数与其中 P 倍数的个数之比与未筛前它们之间的i 比保持不变,仍为 1: (P 不等于已筛过的素数) 。直至筛剩数中不再有 Pii 的倍数。i 证明定理之前,先证明两个引理。 引理 1:在不大于 N 的
3、自然数集合中,一个不大于 的素数 P 的倍数集Nk 2 合,或几个不大于 的素数 P ,P .的公倍数集合,其中有 的元素是 P 的Nkj i1i 倍数(前者中 P P ,后者中 P 不等于 P ,P .中的任一素数) 。ikikj 证明: 前者集合可表示为 P (1, 2, 3)k 后者集合可表示为 P P .(1,2,3 )j 显然,自然数列中某个项是 P 的倍数时,该集合这个元素也是 P 的倍数,i i 而自然数列中有 的项是 P 的倍数,故得引理。但若前者集合中 P = P ,后i1i ik 者集合中 P 等于 P ,P .其中之一时,该集合所有元素便都是 P 的倍数,故ikj i 应
4、除外。 引理 2:正整数等差数列中有 的项是 P 的倍数(P 不等于公差中所含不i1ii 大于 的素因数) 。N 证明:设等差数列中第一个能被 P 整除的项为 mP ,公差为 d,则其后各i i 项为 mP + nd(n=1,2,3.)。显然,n 为 P 的倍数时,该项亦为 P 的倍数,而i i i n(自然数列)中有 的项是 P 的倍数,故得引理。但若 d 为 P 的倍数时,则i1i i 各项均为 P 的倍数,故公差中含该 P 者除外。公差为负数时,该数列为从大到i i 小的正整数等差数列,同样适用本引理。 定理的证明: 不大于 N 的自然数集合可以划分出不同层次的子集合:不大于 的各个N
5、素数的倍数集合,是第一层次的子集合;两子集交集, 即两素数公倍数集合, 是 第二层次的子集合;三素数公倍数集合,又是其中两素数公倍数集合的交集, 这是第三层次的子集合; 以此类推 .(显然,这些子集合没有把大于 的素数 包括进去) 。由引理 1 知,从不大于 N 的自然数集合到各层次各子集合,都各 自有 的元素是 P 的倍数(P 不等于该集合公有的素因数) 。所以,当我们在i1ii 3 不大于 N 的自然数集合中筛掉 2 的倍数时,对于各层次各集合来说,除全部元 素都是 2 的倍数的子集合是被整体筛去外,其他各集合都是被筛去自身元素数 的 ,也就是这些集合的元素数都同时缩小 。所以各层次各集合
6、剩余元素数1 21 分别与其中所含其他子集元素数之比,仍保持未筛前它们之间的比值不变,即 仍为 1: (此时 P 2) 。同理,再筛去自然数集合剩余元素中 3 的倍数,除ii 全部元素都是 3 的倍数的子集合被整体筛去外,其他各层次各集合都被筛去自 身所剩元素的 ,即这些集合的元素个数又同时缩小 。所以,再次剩余的各31 层次各集合元素数与其中所含其他子集合元素数之比仍保持 1: 不变(此时iP P 不等于 2 和 3) 。以此类推,定理得证。i 我们在证明定理的同时,也得到了求 N 以内素数个数即 (N) 的筛法,就 叫集合筛法。因为筛去 P 的倍数中包括 1 倍即 P 本身,所以 (N)的
7、渐近表达i i 式要加上 P 的个数;又因“1”不是素数,故应减去 1,即:i (N)N(1- )(1- )(1- )(1- )+s-1123s =N (1- )+s-1 (P =2, P ) si1iP1sN 如前所述,把 视为 推导出的 (N)的渐近表达式,必然存在误差。iNi 下面,我们对误差做一些初步的分析和讨论: 1. 集合筛法的本质,就是在不大于 N 的自然数集合中按比例逐步筛去不大 于 的各个素数的倍数,即全部合数。因为 N 不可能被大多数不大于 的N 素数整除,所以每次得出的筛剩数大多不是整数,如果每次都取整,必然会造 成累积性误差,而且对筛剩数取整与本该对被筛数取整适得其反,
8、最终必然导 致完全错误的结论。而计算过程不取整,分数部分将在随后的计算中体现其存 在的作用。也可以这样理解:表达式中(1- )这部分是计算素数在自然数集iP1 合中所占的比值,所以不须也不能取整,与 N 相乘后才是素数个数,则应四舍 五入保留整数。因为避免了累积性误差,这样得出的结果,误差自然不会大, 而且当 N 很大时,误差绝对值与实有素数之比,即相对误差会更小(见附表一) 。 4 这里可能会提出这样一个问题:对比依据逐步淘汰原则得出的 (N)表达 式,这个误差应该包括 2 个误差项(即有 2 个需要取整的项) ,这样多的误差s s 项,致使人们得出厄氏筛法“几乎无用”的结论。而集合筛法认为
9、这个误差并 不大,该如何解释呢?其实,误差项多不等于误差大,因为在那个 (N)表达 式中,误差项(取整项)有正有负,是可以相互抵消的。 2. N 只要在 P 和 P 之间,(1- )的值都是相同的(即尚无下一个小2s21siP1 于 的素数) ,而这个值与该区间每个自然数相乘都会得到一个不同的值。如 果该区间连续多个自然数都是合数,就会出现计算值增加了而实际素数个数并 未增加的现象。相反,如果该区间频繁出现素数,甚至孪生素数,三生素数, 就又显示为计算值未增加多少,实际素数个数却增加较多。进而言之,素数在 自然数中分布是不均匀的,N 处于素数稠密区结束处,计算值会小于实际值, 呈负误差;N 处
10、于素数稀疏区结束处,计算值会大于实际值,呈正误差(本文一 律将计算值大于实际值的误差称为正误差,反之称为负误差)。误差的忽大忽小, 忽正忽负,就是集合筛法误差的不规则性。上述 N 很大时相对误差会更小,是 从误差绝对值的上限来比较的。 3集合筛法依据的是规律而非概率,在一定前提下,误差的存在并不影响 我们对规律的利用。对于一些并不要求绝对准确值的命题或猜想(如孪生素数 猜想和三生素数猜想只要求证明其无穷多;哥德巴赫猜想只要求证明大于 4 的 偶数最少可分解为一个两奇素数相加的对子) ,我们完全可以利用它作为证明的 工具。 附表一: 用 (N) 渐近表达式计算的素数个数与实际个数对比 N 计算值
11、 实际值 误差 误差(绝对值)实际 值 100 26 25 1 0.040 500 93 95 -2 0.021 1,000 163 168 -5 0.029 2,000 296 303 -7 0.023 5,000 666 669 -3 0.004 10,000 1227 1229 -2 0.002 50,000 5194 5133 61 0.012 100,000 9716 9592 124 0.013 5 孪生素数猜想的证明 孪生素数是相差为 2 的素数对。证明孪生素数猜想就是要证明这样的素数 对有无穷多。我们的基本思路是:在相差为 2 的奇数对集合中筛掉那些最少有 一奇数是合数的对子,
12、剩下的就是孪生素数对。我们来推导不超过 N 的自然数 中孪生素数对子数即 Z(N)的渐近表达式。先把不大于 N 区间相差为 2 的奇数 对集合按如下形式列出进行观察分析: 1 , 3 3 , 5 5 , 7 7 , 9 9 , 11 11 , 13 13 , 15 15 , 17 17 , 19 19 , 21 (N 为偶数时) N-3 , N-1 (N 为奇数时) N-2, N 不难看出, N 为偶数时,不大于 N 区间相差为 2 的奇数对有 -1 对,N 为2 奇数时则有 对。表达式仅以 N 为偶数表示。12 为了便于叙述,我们约定如下简称:其中一奇数是 3 的倍数的对子称为含 3 对,其
13、中一奇数是 5 的倍数的对子称为含 5 对,以此类推。 对于相差为 2 的奇数对集合,一奇数含某个不大于 的素因数的对子集 合是它的子集合,我们称它为第一层子集合;既是含 P 对又是含 P 对(P ,Pkjk 均 )的奇数对集合,是这两个子集合的交集,此为第二层子集合;三子jN 集交集是其中两子集交集的子集,此为第三层子集合;以此类推(可以看出这些 子集合没有把大于 区间的孪生素数包括进去) 。不论几个子集的交集,其元 素都可分为两种类型:一种是各子集自身公有的素因数(简称命名素数,如含 3 对的命名素数是 3,含 5 对的命名素数是 5)包含在其中一个奇数中,也即一 奇数是各子集命名素数的公
14、倍数,另一奇数则不含这些命名素数,我们把这类 对子称为公倍数对;另一种是这些命名素数分含在两个奇数中,即一个命名素 数的倍数或几个命名素数的公倍数与另一个命名素数的倍数或几个命名素数的 公倍数相遇在一个奇数对中,我们把这类对子简称为相遇对。例如在含 3 对、 含 5 对、含 7 对三子集交集中,105 和 107 这对奇数属于公倍数对,75 和 77 这 对奇数属于相遇对。 6 下面我们来分析各层次各集合元素数分别与其中所含其他子集元素数的比。 1.奇数对集合元素数分别与各子集元素数的比: 从纵列看,每列都是一个 连续的奇数数列。由定理知,每列奇数都有 的项是 P 的倍数,又因相差为 2i1i
15、 的两奇数不可能被同一素数整除,所以奇数对集合中有 的元素是含 P 对。即i2i 奇数对集合元素数分别与其中所含各子集元素数之比为 1: 。i 2. 各子集元素数分别与其中所含其他各子集元素数(即相关两子集交集的元 素数) 的比 :以含 5 对集合与其中的含 3 对元素为例 ,由定理和引理 1 知,5 的奇 数倍集合中有 的元素是 3 的倍数,所以含 5 对集合中有 的元素是二者交集1 3 中的公倍数对;另外,一列奇数中 5 的倍数与另一列奇数中 3 的倍数相遇的周 期是 15 个奇数,即每 3 个 5 的倍数中有一个与 3 的倍数相遇,故含 5 对集合中 有 的元素是二者交集中的相遇对。两者
16、合计,含 5 对集合中有 的元素是含3 2 3 对。同理可推知:第一层各子集元素数分别与其中所含其他子集元素数之比 为 1: 。iP2 3. 各交集元素数分别与其中所含其他子集(即不包括形成该交集的子集) 元素数的比: 先说公倍数对。公倍数对可分为公倍数在前一奇数位和公倍数在 后一奇数位两类。把每类公倍数对摘出来按原顺序排列,其公倍数和与之配对 的奇数就是两列以最小公倍数 2 倍为公差的等差数列。如含 3 对和含 5 对交集 中的两类公倍数对: 公倍数在前 公倍数在后 15 , 17 13 , 15 45 , 47 43 , 45 75 , 77 73 , 75 105 , 107 103 ,
17、 105 据引理 2,每列奇数中都有 的项是 P 的倍数,而同一奇数对的两奇数不i1i 可能同时被该 P 整除,所以每类公倍数对中都有 的元素是含 P 对。则全体公i i2i 倍数对中就有 的元素是含 P 对。i2i 7 再说相遇对。在两子集交集的相遇对中,按各子集命名素数的倍数在前后 奇数位的不同,可分为两类相遇对。因为每类相遇对的相遇周期都是两子集命 名素数最小公倍数的 2 倍,所以每类相遇对按原顺序排列,也形成两列公差相 等的等差数列。如含 3 对和含 5 对交集中的两类相遇对: 3 的倍数在前 5 的倍数在前 3 , 5 25 , 27 33 , 35 55 , 57 63 , 65
18、85 , 87 93 , 95 115 , 117 如果是多个子集的交集,各子集命名素数分含在两个奇数中,就有多种组 合情况。如含 3 对、含 5 对、含 7 对交集中的相遇对:有 3 的倍数与 5 和 7 的 公倍数相遇,有 5 的倍数与 3 和 7 的公倍数相遇,有 7 的倍数与 3 和 5 的公倍 数相遇,每种相遇又按两数处在前后奇数位的不同分为两类。不论哪种组合的 哪类相遇,把属于它的元素按原顺序排列,都是以各命名素数最小公倍数的 2 倍为公差的两列等差数列。如 3 和 5 的公倍数与 7 的倍数组成的相遇对(公差 为 3572=210): 3 和 5 的公倍数在前 3 和 5 的公倍
19、数在后 75 , 77 133 , 135 285 , 287 343 , 345 495 , 497 553 , 555 所以各类相遇对中都有 的元素是含 P 对,则全体相遇对中有 的元素i2i iP2 是含 P 对。i 公倍数对和相遇对各有 的元素是含 P 对,所以整个交集就有 的元素i2i i2 是含 P 对。即各交集元素数分别与其中所含其他子集元素数之比为 1: 。i iP 根据以上分析得出:从相差为 2 的奇数对集合到各层次各子集合,都各自 有 的元素是含 P 对。所以,当我们用集合筛法在相差为 2 的奇数对集合中首i2i 先筛去含 3 对时,除全部元素都是含 3 对的子集合是被整体
20、筛去外,其他各层 次各集合都是被筛去自身元素数的 ,也就是这些集合的元素个数都同时缩小2 8 了 ,所以奇数对集合的剩余元素数分别与各子集的剩余元素数之比,以及各32 子集剩余元素数分别与其中所含其他各子集元素数之比,保持未筛前它们之间 的比值不变,即仍为 1: (此时 P 3) 。同理,再在剩余奇数对集合中筛去i2i 含 5 对,除全部元素都是含 5 对的子集合被整体筛去外,其余各层次各集合剩 余元素数又同时缩小了 ,所以新剩余的各层次各集合中仍各有 的元素是含iP2 P 对(此时 P 不等于 3 和 5) 。以此类推,直至筛掉不大于 N 区间奇数对集合ii 中所有含 P 对 ,剩下的奇数对
21、就都是孪生素数。但因 P 的倍数包括 P 本身,i i i 这样就将不大于 区间的孪生素数也筛掉了,所以不大于 N 区间孪生素数对N 子数即 Z(N)的渐近表达式为: Z(N) ( -1)(1- )(1- )(1- )+Z( )21P2sP =( -1) (1- )+ Z( ) (P =3, P )N si1iN1sN 由上式可以看出,只要 N 为有限数,(1- )就是有限项相乘,其值总大i2 于 0。又因随着 N 的增大,新的(1- )的值越来越接近 1,所以与( -1)的匀sP2N 速增大相比,(1- )的缩小速度要慢得多,而且越来越慢。所以,随着 N 的iP2 增大,总会有新的孪生素数出
22、现,即 Z(N)(当 N) 。当然,与 (N)的 渐近表达式同理,用 Z(N)的渐近表达式计算的孪生素数对子数也存在误差,但 很明显,误差的存在并不影响结论的成立。 附表二:(见下页) 9 用 Z(N) 渐近表达式计算的值与实际值对比 N 计算值 实际值 误差 误差(绝对值)实际 值 100 9 8 1 0.1250 500 24 24 0 0 1,000 36 35 1 0.0286 2,000 59 61 -2 0.0323 3,000 80 81 -1 0.0123 4,000 99 103 -4 0.0388 5,000 118 125 -7 0.0560 100,000 1250 1
23、224 26 0.0212 10 三生素数猜想的证明 P 为素数,P+2 和 P+6 也是素数,就是一个三生素数组。三生素数猜想要求 证明这样的素数组有无穷多。 显然,三生素数是在连续四奇数中除第三个奇数(简称三号位)外,其余 都是素数。事实上,P 和 P+2 都是素数时,P+4 必然是 3 的倍数(3,5,7 例外, 因为 3 既是素数又是 3 的倍数) ,所以我们以下分析中提到四奇数组时,均将三 号位排除在外,只考虑另外三个奇数。我们证明三生素数猜想的基本思路是: 在不大于 N 区间的连续四奇数组集合中,筛掉那些除三号位外还有合数的奇数 组,剩下的就是三生素数组。先观察下列连续四奇数组:
24、1 , 3 , 5 , 7 3 , 5 , 7 , 9 5 , 7 , 9 , 11 7 , 9 , 11 , 13 9 , 11 , 13 , 15 11 , 13 , 15 , 17 13 , 15 , 17 , 19 15 , 17 , 19 , 21 17 , 19 , 21 , 23 (N 为偶数时) N-7 , N-5 , N-3 , N-1 (N 为奇数时) N-6 , N-4 , N-2 , N 不难看出,在不大于 N 区间,除最后三个奇数外,每个奇数都能居一号位 组成一个四奇数组,所以四奇数组集合的元素数:N 为偶数时为 -3,N 为奇2 数时为 -3,渐近表达式中仅以 N
25、为偶数表示。21 为了叙述方便,先约定如下简称:除 3 号位外,有一个或两个奇数是 3 的倍 数的奇数组称含 3 组;有一个奇数是 5 的倍数的奇数组称含 5 组,以此类推。 在连续四奇数组集合中,各含 P 组(P 表示不大于 的奇素数)是它的子集ii N 合;两子集合公共元素的集合是这两子集的交集,也是同属这两子集的子集; 三子集交集是其中两子集交集的子集;四子集交集是其中三子集交集的子 集(可以看出,这些子集合没有把大于 区间的三生素数包括进去) 。不 论几个子集的交集,其元素都可分为两种:一种是其中一奇数是形成该交集各 子集命名素数的公倍数,简称公倍数组;另一种是各子集命名素数分含在两个
26、 或三个奇数中,简称相遇组。 下面我们来分析各层次各集合元素数分别与其中所含其他子集元素数的比。 1. 四奇数组集合元素数分别与各子集元素数的比:从纵列看,每一列都是 11 连续的奇数数列,其中都有 的项是 3 的倍数,但因一号位是 3 的倍数时,四1 号位也是 3 的倍数,所以含 3 组数等于 3 的倍数在前两列奇数中出现的次数, 可知在四奇数组集合中有 的元素是含 3 组。凡大于 3 的素数的倍数在一组中2 最多只能出现一次,所以除含 3 组外,四奇数组中有 的元素是含 P 组。i i 2. 各子集元素数分别与其中所含的含 3 组元素数以及与其中所含其他子集 元素数之比。先以含 5 组集合
27、与其中所含的含 3 组元素为例:首先,5 的倍数 中有 的数是 3 的倍数,所以 3 与 5 的公倍数组在含 5 组中占 ;其次,3 的倍1 1 数与 5 的倍数相遇分以下几种情况:因一号位 5 的倍数与四号位 3 的倍数相遇 时,它自身也是 3 的倍数,此类相遇已归入公倍数组中,所以只考虑一号位 5 的倍数与二号位 3 的倍数相遇;同理,四号位为 5 的倍数时,也只考虑其与二 号位 3 的倍数相遇;二号位 5 的倍数则只需考虑其与一号位和四号位其中之一 的 3 的倍数相遇。所以不论 5 的倍数在哪个位置,每三个 5 的倍数中有一个能 与 3 的倍数相遇,所以相遇组在含 5 组中也占 。公倍数
28、组与相遇组合计,含31 5 组中有 的元素是含 3 组。2 含 5 组集合元素数与其中所含其他子集元素数的比则不同。因为大于 3 的 素数的倍数在一个奇数组中最多只能出现一次,5 的倍数要与另外两列奇数中 P (P 3)的倍数相遇,所以一奇数含 P 的相遇组在含 5 组中各占 ,与公倍ii i i2 数组合计,含 5 组集合中有 的元素是含 P 组( P 3) 。i3ii 同理可推知:第一层各子集(含 3 组除外)的元素数与其中所含含 3 组的 元素数之比为 1: ;各子集元素数(包括含 3 组)分别与其中所含其他子集32 的元素数之比为 1: 。iP 3. 各交集元素数分别与其中所含其他子集
29、(即不包括形成该交集的各子集) 元素数的比。首先,公倍数组可分为公倍数在一号位、二号位、四号位三类。 每一类公倍数组的元素按原顺序排列,就形成三列公差相等(形成该交集各子 集命名素数最小公倍数的 2 倍)的等差数列。如含 5 组与含 7 组交集中之公倍 数组,公倍数在一号位时,三列等差数列(纵列)是: 35 , 37 , ( ) , 41 105 , 107 , ( ) , 111 175 , 177 , ( ) , 181 12 其中一号位是 3 的倍数时,四号位也是 3 的倍数,而大于 3 的素数的倍数 在同一组中最多只能有一个,据引理 2 便可推知,各层次各交集的公倍数组集 合中除有 含
30、 3 组外,有 含 P 组(P 不等于形成本交集各子集命名素数) 。2iii 其次,相遇组集合中,虽然多子集交集的多个命名素数有多种组合的相遇, 每种组合又因所在奇数位不同(一,二,四号位)而分三类,但因他们各自的 相遇周期不变,所以只要把同种同类相遇组的元素按原顺序排列,就形成三列 公差为这些命名素数最小公倍数 2 倍的等差数列。所以与公倍数组集合一样, 相遇组集合中除有 含 3 组外,有 含 P 组。则整个交集中有 含 3 组,有2ii 2 含 P 组( P 3) 。i3ii 综合以上分析可得:从四奇数组集合到各层次各子集合,各自元素数与其 中所含含 3 组元素数之比为 1: ,与其中所含
31、其他子集元素数之比为 1: 32 。所以,我们可用集合筛法,首先在四奇数组集合中筛去含 3 组,即( -iP 2N 3) (1- ),除全部元素都是含 3 组的子集合被整体筛去外,其他各层次各集合2 都被筛去自身元素的 ,即各集合元素数同时缩小了 ,所以剩余的四奇数组232 数分别与各子集的剩余元素数之比,以及各层次各子集剩余元素数分别与其中 所含其他子集元素数之比,均保持他们之间原来的比值不变,即仍为 1: (此时 P 3) 。同理,再在剩余的四奇数组中筛去含 5 组,即( -3) (1-ii 2N ) (1- ) ,除全部元素都是含 5 组的子集合被整体筛去外,其余各层次各集25 合的元素
32、数又同时缩小了 ,所以各集合剩余元素数分别与其中所含其他子集3 元素数之比仍保持 1: 不变(此时 P 不等于 3 和 5) 。以此类推,直至筛去所i i 有含 P 组,剩下的就都是三生素数。但因 P 的倍数包括 P 本身,致使不大于i i i 区间的三生素数也被筛掉了,所以不大于 N 区间三生素数组数即 E(N)的渐N 近表达式为 13 E(N)( -3)(1- )(1- )(1- )(1- )+ E( ) 2N3573sPN =( -3)(1- ) (1- )+ E( ) (P ) sP52i s 由上式可以看出,只要 N 有限,(1- )(1- )就是有限项相乘,其值总3iP 大于 0;
33、又因随着 N 的增大,新的(1- )的值越来越接近 1,与( -3)的匀速s 2N 增大相比,(1- )(1- )的缩小速度要慢得多,而且越来越慢,所以随着 N32iP 的增大,总会有新的三生素数出现,即 E(N)(当 N) 。当然,与 (N) 的渐近表达式同理,由 E(N)渐近表达式计算的三生素数组数与实有组数会有差, 但三生素数猜想只要求证明其无穷多,所以误差的存在不影响结论的成立。 附表三: 用 E(N)渐近表达式计算的值与实际值对比 N 计算值 实际值 误差 误差(绝对值)实际 值 100 4 4 0 0 300 7 8 -1 0.125 500 9 11 -2 0.182 1,000
34、 13 15 -2 0.153 2,000 19 22 -3 0.136 3,000 26 28 -2 0.071 4,000 30 33 -3 0.091 5,000 35 40 -5 0.125 14 哥德巴赫猜想的证明 哥德巴赫猜想要求证明大于 4 的偶数都是两个奇素数的和(其推论为大于 7 的奇数都是 3 个奇素数的和) 。我们证明这个问题的基本思路是:大于 4 的偶 数 N 都可以表示成 个两奇数相加的对子,在这些奇数对集合中筛去那些最少4 有一奇数是合数的对子,剩下的对子除 1+(N-1)外,都是素数对。只要证明大 于 4 的偶数最少有这样一个素数对,就是证明了哥德巴赫猜想。 我们
35、还是用分析的方法来推导和等于偶数 N 的素数对子数即 D(N)的渐近表 达式。我们将和等于 N 的奇数对集合写成下面的形式进行观察分析: 1 + (N-1) 3 + (N-3) 5 + (N-5) 7 + (N-7) 9 + (N-9) 11 + (N-11) ( -1) + ( +1) (当 N 能被 4 整除)2N2N 或 + (当 N 不能被 4 整除) N 不能被 4 整除时,不大于 N 区间有奇数个奇数,居中的奇数自成一个奇 数对。故实际计算时,应将 进为整数。4 为了叙述方便先约定以下简称:奇数对中有一奇数是或两个奇数都是 3 的 倍数的对子通称含 3 对。两奇数都是 3 的倍数者
36、称含 3 自配对;一奇数是 3 的 倍数,另一奇数不是 3 的倍数者称含 3 他配对。其他以此类推。 在和等于 N 的奇数对集合中,各含 P 对是它的子集合;一个子集合中所含i 的另外一个子集合的元素集合,是这两个子集合的交集,也是同属这两个子集 的子集;同属三子集的元素集合是其中两子集交集的子集;同属四子集元素的 集合是其中三子集交集的子集(可以看出这些子集合没有把大于 的两N 素数相加等于 N 的对子包括进去) 。我们把各交集元素中最少有一个奇数是形 成该交集各子集命名素数公倍数的对子简称为公倍数对;这些命名素数分含在 两奇数中的对子简称为相遇对;既是公倍数对,又符合相遇对条件的对子计入
37、公倍数对,不算相遇对(如 N=54 时,9+45 这一对是含 3 对与含 5 对交集中的 公倍数对,不算相遇对) 。 下面我们来分析各层次各集合元素数分别与其中所含各子集元素数的比。 1. 和等于 N 的奇数对集合元素数分别与各子集元素数的比:从纵列看,前 一列是从小到大的奇数数列,后一列是从大到小的奇数数列。由定理知,两列 15 奇数中都有 的项是 P 的倍数(3 P ) 。故若 P 能整除 N,则含 P 对i 1i iNi i 为自配对,在奇数对集合元素数中占 ;若 P 不能整除 N,则含 P 对为他配对,i1i i 在奇数对集合元素数中占 。iP2 2. 各子集元素数分别与其中所含其他各
38、子集元素数(即相关两子集交集的 元素数)的比:先以含 5 对集合与其中所含含 3 对元素为例: (1)若含 3 对为自配对,不论含 5 对是自配对还是他配对,他们的交集中 只有公倍数对,没有相遇对,因为 5 的倍数与 3 的倍数相遇时,它自身也是 3 的倍数,此类对子已归入公倍数对。据引理 1,含 5 对集合中有 的元素是含1 3 对。 (2)若含 3 对是他配对,不论含 5 对是自配对还是他配对,它们的交集中 既有公倍数对,也有相遇对。因为每 3 个 5 的倍数有一个与 3 的倍数相遇,所 以含 5 对集合中有 的元素是属于相遇对的含 3 对;另有 的元素是属于公倍1 1 数对的含 3 对。
39、二者合计,含 5 对集合中有 的元素是含 3 对。2 同理可推知:若 N 能被 P 整除时,各子集元素数与其中含 P 对元素数之比i i 为 1: ;若 N 不能被 P 整除时,各子集元素数与其中含 P 对元素数之比为 1:iPi i 。i2 3. 各交集元素数与其中所含其他子集(即不包括形成该交集的子集)元素 数之比:先看公倍数对。公倍数对可分为公倍数在前一奇数位、公倍数在后一 奇数位、两奇数都是公倍数三类。不论哪类公倍数对,把属于它的元素按原顺 序排列,前后两奇数就形成两列公差绝对值相等(形成该交集各子集命名素数 最小公倍数的 2 倍)正负相反的等差数列。据引理 2 可推知,如果 N 能被
40、 P 整i 除,这些公倍数对集合中就有 的元素是含 P 对( P 不等于形成该交集各子集i 1ii 命名素数) ;如果 N 不能被 P 整除,这些公倍数对集合中就有 的元素是含 Pi i 2 对。同样,在相遇对集合中,虽然多个命名素数相遇在一个奇数对中,有多种i 16 不同组合,每种组合又按其在前后奇数位的不同分为两类,但不论哪种组合的 哪类相遇,每一类相遇对按原顺序排列,前后两奇数必然形成两列公差绝对值 相等(形成该交集各子集命名素数乘积的 2 倍)正负相反的等差数列。因此也 得到同样结论:如果 N 能被 P 整除,相遇对集合中就有 的元素是含 P 对;i i1i 如果 N 不能被 P 整除
41、,相遇对集合中就有 的元素是含 P 对。所以不论某交i i2i 集只有公倍数对没有相遇对,还是既有公倍数对又有相遇对,该交集元素数与 其中所含其他子集元素数之比都同样:如果 N 能被 P 整除,其比为 1: ;如i i 果 N 不能被 P 整除,其比为 1: 。i iP2 根据以上分析结果,我们首先在和等于 N 的奇数对集合中筛去含 3 对,即 (1- )或 (1- ),就等于各层次各子集合中除全部元素都是含 3 对的子集合4312 被整体筛去外,其他各集合都被筛去各自所有元素数的 或 ,也即奇数对集12 合和各层次各子集合各自所有的元素数都同时缩小了 或同时缩小了 ,所以33 奇数对集合剩余
42、元素数分别与各子集剩余元素数之比,以及各层次各子集合剩 余元素数分别与其中所含其他子集合元素数之比,均保持未筛前它们之间的比 不变,即仍为 1: 或 1: (此时 P 3) 。同理,再在剩余的奇数对中筛去iP1i2i 含 5 对,即给剩余奇数对子数再乘以(1- )或(1- ) ,新剩余的奇数对集合512 元素数分别与其中所含其它子集元素数之比,以及各层次各子集合元素数分别 与其中所含其它子集合元素数之比仍然不变。以此类推,直至筛去所有一奇数 或两奇数为小于 的素数的倍数的对子,最后剩余的奇数对除 1+(N-1)这N 对外,都是素数对。 至于 1+(N-1)这对,如果 N-1 是合数,它必是某个
43、 P 的倍数,故已被筛i 去;如果(N-1)是素数,则未被筛去,但因“1” 不是素数,应另行筛去,式 中用 c 表示。另外,因为小于 的素数同时也是自身的倍数,使它与另一素N 数组成的对子也被筛去了,所以计算偶数 N 等于两素数相加的对子数即 D(N)时,还要加上小于 的素数实际组成的素数对子数,式中用 b 表示。 根据以上分析,我们可以列出 D(N)的渐近表达式: 17 D(N) (1- )(1- )(1- )+b-c4N1Pa2sPa = (1- )+b-c (P =3,P ) si1i 1sN 1 (当 N 能被 P 整除)i a = 2 (当 N 不能被 P 整除)i 可见在实际计算时
44、,首先要对 N 进行因数分解,还要对 N-1 和每个 N- P 是否素数进行判断,否则无法计算。下面举两个计算的例子:i 1. N=210=2357 13 17210 b=2 (即 11+199;13+197) c=0 (即 209 为合数) D(210) (1- )(1- )(1- )(1- )(1- )+2-019421035173 (210 实际可表为素数相加的对子为 19 对,误差为 0) 2. N=256=2 13 178 256 b=1 (即 5+251) c=0 (即 155 为合数) D(256) (1- )(1- )(1- )(1- )(1- )+1-0742563713 (
45、256 实际可表为两素数相加的对子为 8 对,误差为-1) 附表四:(见下页) 18 用 D(N)渐近表达式计算的值与实际值对比 N 因数分解 PSb c 计 算 值 实 际 值 误 差 误差 (绝对值) 实际值 12 2 3 3 0 1 1 1 0 0 64 267 2 0 4 5 -1 0.2000 256 2813 1 0 7 8 -1 0.1250 512 2919 2 0 12 11 1 0.0909 578 217 23 1 1 11 12 -1 0.0833 840 2 357323 5 1 52 50 2 0.0400 1022 2773 31 3 1 21 18 3 0.16
46、67 1024 21031 3 0 19 22 -3 0.1364 1386 23 711 37 3 0 57 57 0 0 2048 2143 3 0 30 25 5 0.2000 2306 21153 47 3 0 32 34 -2 0.0588 2310 235711 47 7 1 111 113 -2 0.0177 4096 2161 5 0 52 53 -1 0.0189 4106 22053 61 2 0 49 52 -3 0.0577 4290 2351113 61 9 1 167 161 6 0.0373 4998 237 17267 8 0 150 143 7 0.0489
47、5000 2 53467 5 1 78 75 3 0.0400 19 5002 24161 67 3 0 61 56 5 0.0893 由渐近表达式可以看出,N 不含小于 的素因子时, a 的值皆为 2,可见N 此类偶数与 和它相近的其他偶数相比,能表为两素数相加的对子数最少,所以 证明哥德巴赫猜想只要证明此类偶数的 D(N)1 即可。但是,证明过程还必须 设法消除误差的影响,否则即使证明了 D(N)1,还须考虑会不会因为误差而 使这个结论不成立。我们仍然用分析的方法来证明。 1. 将 (1- )展开来观察: si1iP2 (1- )= si1i35719375sP2 显然,后一乘数的分子总是大于或等于(遇到孪生素数时)前一乘数 的分母。我们一律把两者视为相等进行约分,可将其值约为 。这等于大大减s1 小了 D(N)的计算值。减小的部分可以用来抵消计算值可能大于实际值的误差 (正误差) 。这在 N 很小时作用还不够明显,特别是 N11 时,后一乘数的分2 子和前一乘数的分母本来就是相等的,并未让出可抵消正误差的值。但是当 N 不断增大时,让出的可抵消正误差的值就会越来越大。虽然正误差的上限也会 随 N 逐渐变大,但前者变大的速度比后者要快得多。 2. 我们再将 换成 。因为 P ,所以 。这就又一次sP1NsN1sP 减小了 D(N)的计算