推荐系统实践

1.互联网搜索及推荐发展

1）早期的孤岛式网站，门户网站出现，网站导航，属于针对网站的推荐。但是内容的获取还是需要到相应网站上去浏览。

2）搜索引擎：用户可以主动检索内容

3）推荐系统：主动的推荐用户感兴趣的物品，广告定向投放等。推荐系统发展：热销推荐->个性化推荐->捆绑式推荐。

netflix：研究的是预测用户看了电源后会给出怎样的评分。更有意义的应该是用户可能会喜欢的电源。

1）用户满意度：调查问卷或网站上收集

2）预测准确度：平方根误差（RMSE）、平均绝对误差（MAE）

3）召回率（recall）

4）准确率（precision）

5）覆盖率：如何发掘长尾商品。所有物品均有相等的机会出现在推荐列表中，出现的次数差不多，则该推荐系统覆盖率较高。通过流行度、基尼系数确定。推荐系统理论上应该尽量避免马太效应（强者更强，弱者更弱）。但是协同过滤算法等都有马太效应，某些卖家也可能有马太效应的需求。基尼系数评测是否有马太效应。

6）多样性：不在一棵树上吊死

7）新颖性：不要推荐哪些用户已经熟知，本来要购买的商品。计算推荐列表的平均流行度，愈不流行越有新意。多是长尾商品。

8）惊喜度：与新颖性有区别。惊喜度是用户本来不喜欢这个style，但是你推荐给了他，同时他看完之后又很满意。

9）信任度：提高推荐信任度的方式：增加透明度（比如：推荐解释），利用社交网络进行推荐。

10）实时性

11）健壮性：避免被攻击。BAB比VAV更有价值就是因为购买记录比访问记录更可信，更能避免注入攻击。

12）商业目标：理论与实际总是有差距，只有符合特定的商业目标才是好的推荐。

用户维度、物品维度、时间维度。

离线试验、用户调查、在线试验。