推荐系统评估测试

1. A/B测试

　　新推荐模型上线前要进行A/B测试，与旧的算法比较。AB测试是一种很常用的在线评测算法的实验方法。它通过一定的规则将用户随机分成几组，并对不同组的用户采用不同的算法，然后通过统计不同组用户的各种不同的评测指标比较不同算法，

比如可以统计不同组用户的点击率，通过点击率比较不同算法的性能。

　　用户进入网站后，流量分配系统决定用户是否需要被进行A/B测试，如果需要的话，流量分配系统会给用户打上在测试中属于什么分组的标签。然后用户浏览网页，而用户在浏览网页时的行为都会被通过日志系统发回后台的日志数据库。此时，如果用

户有测试分组的标签，那么该标签也会被发回后台数据库。在后台，实验人员的工作首先是配置流量分配系统，决定满足什么条件的用户参加什么样的测试。其次，实验人员需要统计日志数据库中的数据，通过评测系统生成不同分组用户的实验报告，并比较和评测实验结果。当完成了AB测试后，根据指标结果，如果优于之前的推荐算法，那么旧的算法就可以替换成新的了。

2. 其他指标

3. 参考文献

　　https://juejin.im/post/5d75ad14f265da03c02c2827