匹配的概率估计

匹配的概率估计

所有人用集合S表示,有个用户群记为A, A是属于S的非空真子集。
已知罪犯a的生日是 (d_1),出生城市(c_1), 在A中只有用户b的生日和出生地和罪犯a相同,
那么罪犯a就是用户b的概率P是?

分析

  • S 表示名字和罪犯a相同的所有用户,假定全国15万, A 表示关注的用户群, 假定5万个。
    • 用户出生于(d_1)的概率是1/10000
    • 出生在城市(c_1)的概率是1/1000
  • 在A的余集中不出现相同生日和出生地的人概率记为 $ P_0 = (1-P(d_1)P(c_1))^n = (1-1/10000 * 1/1000)^{100000} = 0.99 $
  • 在A的余集中出现相同生日和出生地的k人概率记为 $ P_k = C_n^k (1-P(d_1)*P(c_1))^{n-k} (P(d_1)P(c_1))^k ll P_0 $
  • 若$ P_0 > .99 $, 那么 $ P ge P_0 = 99% $

--- 她说, 她是仙,她不是神
原文地址:https://www.cnblogs.com/bregman/p/4818035.html