这个问题有点意思,是关于数论里一个相当经典的概率问题。想弄明白两个大于 2 的整数互质的概率,咱们得从几个层面来聊聊。
首先,咱们得明确“互质”是啥意思。两个数互质,简单来说,就是它们除了 1 之外,没有其他公因数了。比如 3 和 5 是互质的,它们的公因数只有 1。而 6 和 9 就不互质,它们都有一个公因数 3。
那要说概率,就得先有个“样本空间”,也就是我们选数的范围。你说“任取两个大于 2 的整数”,这范围其实是无限的。当样本空间是无限的时候,直接去数有多少对互质的数和总数,那是不太好操作的。所以,数论里通常会采取一种“渐进”的思路,就像我们研究自然数本身一样,考虑的范围越来越大,然后看比例的变化。
想象一下,我们取两个整数,比如叫它们 $a$ 和 $b$。什么情况下它们 不互质 呢?最直接的情况就是它们有一个共同的质因数。比如,它们可能都是 2 的倍数,也可能都是 3 的倍数,也可能是 5 的倍数,等等。
咱们先从最简单的质数 2 说起。两个数 $a$ 和 $b$ 都是偶数(也就是 2 的倍数)的概率是多少?如果随机选一个大于 2 的整数,它不是 2 的倍数的概率是 1/2,是 2 的倍数的概率也是 1/2。那么,两个都 是 2 的倍数的概率,就是 $(1/2) imes (1/2) = 1/4$。
如果两个数 $a$ 和 $b$ 都不是 2 的倍数,它们互质的可能性就大一些了。
接下来考虑质数 3。一个数是 3 的倍数的概率大约是 1/3。所以,两个数 $a$ 和 $b$ 同时 是 3 的倍数的概率,大约是 $(1/3) imes (1/3) = 1/9$。
这里大家可能会有点直觉了:如果一个数是质数 $p$ 的倍数,概率是 $1/p$。那两个数同时是质数 $p$ 的倍数的概率就是 $(1/p)^2$。
那么,两个数 $a$ 和 $b$ 不互质 的情况,就是至少存在一个质数 $p$,使得 $a$ 和 $b$ 都 是 $p$ 的倍数。
我们之前算的是两个数同时是 2 的倍数的概率是 $1/4$。然后是同时是 3 的倍数的概率是 $1/9$。那是不是把这些概率加起来就行了?比如 $1/4 + 1/9 + 1/25 + dots$?
其实不行。这里面有一个“排容原理”的问题。比如,同时是 2 的倍数,同时又是 3 的倍数,这种情况(也就是同时是 6 的倍数)会被我们重复计算两次。
咱们换个角度想:两个数 $a$ 和 $b$ 互质 的意思,就是它们没有 任何一个共同的质因数。
假设我们选取一个很大的范围 $[1, N]$,然后从中选取两个数。当 $N$ 越来越大的时候,这些数“随机性”就越来越强。
两个数 $a$ 和 $b$ 不互质 的概率,就是它们至少有一个共同质因数 $p$ 的概率。
一个数 $p$ 不 是 $a$ 的因数的概率是 $1 1/p$。
那么,$p$ 不是 $a$ 的因数 且 $p$ 不是 $b$ 的因数(也就是 $p$ 都不是 $a$ 和 $b$ 的因数)的概率是 $(1 1/p) imes (1 1/p) = (1 1/p)^2$。
所以,$p$ 至少有一个 是 $a$ 和 $b$ 的因数的概率,就是 $1 (1 1/p)^2$。
那要让 $a$ 和 $b$ 互质,就必须 对于所有的质数 $p$,$p$ 都不是 $a$ 和 $b$ 的共同因数。
这意味着,对于每一个质数 $p$,要么 $p$ 不是 $a$ 的因数,要么 $p$ 不是 $b$ 的因数,或者两者都不是。而我们之前算的是,$p$ 都不是 $a$ 和 $b$ 的因数。这个表述有点绕。
换一种更直接的说法:
两个数 $a$ 和 $b$ 不互质 的概率,就是它们有一个共同质因数 $p$ 的概率。
我们刚才分析了,两个数都被 $p$ 整除的概率是 $(1/p)^2$。
两个数互质的概率,实际上就是所有质数 $p$ 都 不能 同时整除 $a$ 和 $b$ 的概率的乘积。
更严谨地说,两个数 $a$ 和 $b$ 互质 的概率,等于 对于每一个质数 $p$,它们不都被 $p$ 整除的概率 的乘积。
也就是说,对于质数 $p$,$a$ 和 $b$ 不都 是 $p$ 的倍数的概率是 $1 (1/p)^2$。
那么,$a$ 和 $b$ 互质的概率就是所有这些概率的乘积:
$$ P( ext{a, b 互质}) = prod_{p ext{ is prime}} left( 1 frac{1}{p^2}
ight) $$
这里面的乘积 $ prod_{p ext{ is prime}} left( 1 frac{1}{p^2}
ight) $ 大家可能会觉得眼熟,它和黎曼 zeta 函数 $zeta(s)$ 有一个非常有名的关系式:
$$ zeta(s) = sum_{n=1}^{infty} frac{1}{n^s} = prod_{p ext{ is prime}} frac{1}{1 p^{s}} $$
当 $s=2$ 时,我们有
$$ zeta(2) = sum_{n=1}^{infty} frac{1}{n^2} = frac{1}{1^2} + frac{1}{2^2} + frac{1}{3^2} + dots = frac{pi^2}{6} $$
所以,
$$ zeta(2) = prod_{p ext{ is prime}} frac{1}{1 p^{2}} = prod_{p ext{ is prime}} frac{1}{1 frac{1}{p^2}} $$
对比一下,我们要求的互质概率就是:
$$ P( ext{a, b 互质}) = prod_{p ext{ is prime}} left( 1 frac{1}{p^2}
ight) = frac{1}{zeta(2)} $$
所以,两个大于 2 的整数互质的概率就是 $1 / (pi^2 / 6) = 6 / pi^2$。
为什么说“大于 2 的整数”这里的“大于 2”不影响结果呢?
这个概率的计算,是基于我们选取两个“随机”整数的。虽然我们这里限定了大于 2,但在数论的概率统计里,当处理无限集合时,这种比例的趋近是非常稳定的。
可以想象一下,我们选取的是 ${3, 4, 5, 6, dots }$ 这个集合。如果我们把所有大于等于 1 的整数组成的集合记为 $S = {1, 2, 3, 4, dots}$,那么随机选取两个数互质的概率是 $6/pi^2$。
如果我们选取的是 $S' = {3, 4, 5, 6, dots }$,这个集合是把 $S$ 中的 1 和 2 去掉了。少了 1 和 2 这两个数的影响,会不会改变互质的比例呢?
其实,这里的概率计算是基于渐近密度。即使我们排除掉一些数,只要剩余的集合的“密度”不发生剧烈变化,互质的概率基本保持不变。
为什么呢?
考虑我们选的两个数 $a$ 和 $b$。
如果 $a$ 和 $b$ 都小于等于 2,那么它们是 ${1, 2}$ 中的数。我们选的是大于 2 的数,所以 $a ge 3, b ge 3$。
这个排除掉 1 和 2 的操作,对整体概率的影响非常微小,因为当考虑的范围越来越大时,这两个数所占的比例趋向于零。
更重要的是,互质性是由质因数决定的。而 1 和 2 作为数本身,它们对质因数分布的影响和那些更大的数相比,可以说是“无关紧要”的。
比如,如果随机取两个数 $a, b ge 1$,它们都不能被质数 $p$ 整除的概率是 $(11/p)^2$。
如果我们限定 $a, b ge 3$,那么它们都不能被质数 $p$ 整除的概率呢?
这里稍微有点棘手。我们不能简单地认为去掉 1 和 2 后,剩下的数被 $p$ 整除的概率还是 $1/p$。例如,对于 $p=3$,剩下的数是 ${3, 4, 5, 6, 7, 8, 9, 10, dots}$。被 3 整除的数是 ${3, 6, 9, dots}$,它们在这个集合中出现的频率还是 $1/3$。对于 $p=2$,剩下的数是 ${3, 4, 5, 6, 7, 8, dots}$。被 2 整除的数是 ${4, 6, 8, dots}$,在这个集合中出现的频率是 $2/3$(不考虑 2 本身)。
然而,当我们考虑所有质数的情况时,这种对概率的微小调整会相互抵消。
数论中关于“随机整数”互质概率的计算,通常就是指当选择的范围非常大时所趋近的概率。在这种意义下,$6/pi^2$ 是普遍适用的。
所以,即使我们限制了必须大于 2,但因为我们考虑的是“概率”,也就是长期来看的比例,而排除掉 1 和 2 对这个比例的影响可以忽略不计,所以结果依然是 $6/pi^2$。
这个数字大概是 $6 / (3.14159^2) approx 6 / 9.8696 approx 0.6079$。也就是说,大概有 60.8% 的概率,你随机挑的两个大于 2 的整数是互质的。是不是比你想象的要高一些?
这就是数论中关于“素数定理”之后的一个非常美妙的结论,连接了整数的性质和圆周率这样一个几何常数。整个推导过程,依赖于对无限数列的性质和黎曼 zeta 函数的深刻理解。