取快递的数学问题:手机尾号的重复概率

学校门口,四位手机尾号取快递。问:设有 (n) 个包裹,则存在两个包裹号码(收件人手机尾号,假设均匀分布)相同的概率 (P(n)) 是多少?

答曰:手机尾号一共有 (10^4=10000) 个,所以 ( P(n)=frac{A_{10000}^n}{(10000)^n} ), 其中 (A_n^r) 为排列数。

求出表达式非常简单,然而计算具体值时却遇到了麻烦:分子和分母都太大了,IEEE 754 浮点数受不了了,直接扔给我个 Infinity.

怎么办呢?把排列数展开,取对数,乘除变加减:

( log{P(n)} )

( = log{frac{A_{10000}^n}{(10000)^n}} )

( =log{A_{10000}^n}-nlog{10^4} )

( =log{10^4(10^4-1)cdots(10^4-n+1)}-4nlog{10} )

( =log{10^4}+log{(10^4-1)}+cdots+log{(10^4-n+1)}-4nlog{10} )

不想这么麻烦的话,也有很精确的阶乘近似公式可用(这里就不限于整数了):

( left{egin{matrix} n! = Gamma(n+1) \ lnGamma(z) approx frac{1}{2} left[ln(2pi) - ln z ight] + zleft[lnleft(z + frac{1}{12z - frac{1}{10z}} ight) - 1 ight] end{matrix} ight. )

总之,最后能算出来具体的数。下面列出 n 取某些特殊值时的概率:

n 20 40 60 80 100 120 140 160 180 200
P(n) 2% 8% 16% 27% 39% 51% 62% 72% 80% 87%

([20, 200]) 区间内 (y=P(x)) 的函数图像如下(只有 (x) 等于整数的点有实际意义):

看起来有点反直觉:重复的概率怎么这么大?确实这么大,只要手机尾号是均匀分布的。

不过,自己的号跟某个人的号一样(存在某个人跟自己同号)的概率并不大:

所以,重号的概率不小,但自己碰上的概率就很小了。(不过那大得吓人的重号概率还是很反直觉……)

原文地址:https://www.cnblogs.com/li-hua/p/5975693.html