非随机的抽样

为了实验可复制, 考虑基于身份证做确定的采样。

  1. 随机抽样, 身份证第18位, 比较随机的取到11等份。
  2. 生日采样, 注意月,日都不太随机。 如何比较好的取 1/10 用户?
    • 统计每个日期的人数, 然后在1,10, 20日附近做调整。
    • substr(cert_no,13,2) in ('01','11','19')
原文地址:https://www.cnblogs.com/bregman/p/10731352.html