推荐系统实践

1.互联网搜索及推荐发展

1)早期的孤岛式网站,门户网站出现,网站导航,属于针对网站的推荐。但是内容的获取还是需要到相应网站上去浏览。

2)搜索引擎:用户可以主动检索内容

3)推荐系统:主动的推荐用户感兴趣的物品,广告定向投放等。推荐系统发展:热销推荐->个性化推荐->捆绑式推荐。

netflix:研究的是预测用户看了电源后会给出怎样的评分。更有意义的应该是用户可能会喜欢的电源。

2.推荐系统评测指标

1)用户满意度:调查问卷或网站上收集

2)预测准确度:平方根误差(RMSE)、平均绝对误差(MAE)

3)召回率(recall)

4)准确率(precision)

5)覆盖率:如何发掘长尾商品。所有物品均有相等的机会出现在推荐列表中,出现的次数差不多,则该推荐系统覆盖率较高。通过流行度、基尼系数确定。推荐系统理论上应该尽量避免马太效应(强者更强,弱者更弱)。但是协同过滤算法等都有马太效应,某些卖家也可能有马太效应的需求。基尼系数评测是否有马太效应。

6)多样性:不在一棵树上吊死

7)新颖性:不要推荐哪些用户已经熟知,本来要购买的商品。计算推荐列表的平均流行度,愈不流行越有新意。多是长尾商品。

8)惊喜度:与新颖性有区别。惊喜度是用户本来不喜欢这个style,但是你推荐给了他,同时他看完之后又很满意。

9)信任度:提高推荐信任度的方式:增加透明度(比如:推荐解释),利用社交网络进行推荐。

10)实时性

11)健壮性:避免被攻击。BAB比VAV更有价值就是因为购买记录比访问记录更可信,更能避免注入攻击。

12)商业目标:理论与实际总是有差距,只有符合特定的商业目标才是好的推荐。

3.评测维度

用户维度、物品维度、时间维度。

4.评测方法

离线试验、用户调查、在线试验。

原文地址:https://www.cnblogs.com/DjangoBlog/p/3616069.html