【学习笔记】读项亮的《推荐系统实践》

【学习笔记】读项亮的《推荐系统实践》_第六章利用社交网络数据

这一章更多的介绍的也是思想，而非具体的算法。看得也快，不到30分钟，浏览完。

6.1 获得社交网络数据的途径

没想到email是一个很好的途径，能获得挺多信息，如：名字、公司等。

其他的几个，用户注册、用户位置、讨论组等，都需要相关的资源，现实中能有一种就不错了。

facebook的社交网络被称为“社交图谱”，因为需要双向认证，都是认识的人。

twitter的社交网络被称为“兴趣图谱”，因为仅仅需要单向认证，不一定非要认识对方，仅仅感兴趣而已。

6.2 社交网络数据简介

长尾分布而已。

6.3 基于社交网络的推荐

6.3.1 基于邻域的社会化推荐算法

类似于从前的UserCF，只不过用户之间的关系被替换成了社交网络中的好友关系。而如何综合各个好友之间的关系，以及好友与item之间的关系，则成了算法特色（或者说与UserCF不同的地方，或者说需要特殊考虑的地方等等）。

6.3.2 基于图的社会化推荐算法

哪里都离不开图。总之，还能转换成从前熟悉的图算法。

6.3.3 实际系统中的社会化算法

上面哪个系统不实际？基于图那个最不实际，所以在这一节里面提都没有提。基于邻域那个，相对靠谱，但还不实际，原因是需要访问用户所有的历史信息，复杂度太高。那怎么变得实际？两个方法：1. 考虑用户邻域的时候，不考虑所有邻域，而只考虑一部分有限的邻域；2. 考虑好友历史的时候，不考虑所有历史，而只考虑一段时间的历史。这不废话么。

6.3.4 社会化推荐系统和协同过滤推荐系统

没看见这一部分内容多详细的比较了这两个东西，不过有句话说的挺好：社会化推荐的优势不在于增加预测准确率，而在于通过好友的推荐，增加了对推荐结果的信任度。

6.3.5 信息流推荐

微博里面那些帖子怎么排列，如果不是严格按照时间来排列，则就是用到了信息流推荐了。提到了facebook的EdgeRank算法，只提到了名字，因为这个算法不公开。哦，更详细的，与三个因素有关：1. 用户的好友；2. 当前信息所对应的动作（例如：原创、或者转发）的权重；3. 时间衰减。

6.4 个用户推荐好友

基于社交网络的推荐，计算图的入度、出度等。

完。