推荐系统中的Graph Model

转自：http://www.cnblogs.com/wentingtu/archive/2012/05/28/2521166.html

推荐中对graph model的研究主要有两个方面，一个是如何构图，另一个是如何在图上做ranking。

关于构图问题，取决于数据，首先考虑如果我们只有user item的数据，那么最简单的方法就是构造二分图，两类节点，user节点和item节点，如果user喜欢item，就在他们中间连一条边。

如果我们有了用户的profile信息，和item的content信息，这个时候又有了很多构图的方法。一种方法是用这些信息计算出user-user相似度和item-item相似度，然后把这些相似度作为权重，来给user节点之间，和item节点之间加边，这个称为two-layer graph model。相关的可以参考下面两篇论文：
1. A graph-based recommender system for digital library
2. A graph model for E-commerce recommender systems

当然，如果这些额外信息比较单一，比如我们有tag信息，我们可以构造一个3分图，加入tag节点，如果一个item有某个tag，那么他们之间有边，如果一个user用过某个tag，那么他们之间也有边。如果是社会网络信息，我们可以直接将社会网络关系加入到user-user之间。如果我们有user参加某些group的信息，我们可以加入一类group节点，如果一个user参加过一个group，在中间就会有一条边。

基本的构图思想就是上面这些，下面讨论图的rank问题。

图上的rank，分为三大类：

一类是基于图上的随机游走，一般用迭代法，速度很快，相关的论文有：

1.Topic-Sensitive PageRank
2.TrustWalker: a random walk model for combining trust-based and item-based recommendation

还有周涛发表的一些论文，二分图上的扩散等

另一类是把推荐的问题看做一个半监督学习的问题，从而用传播的算法，最经典的是下面这篇博士论文
Semi-Supervised Learning with Graphs
这篇文章的作者是用图做半监督学习的权威

最好一类是用图的Laplacian矩阵来度量图中顶点的相似度，最经典的工作是下面这篇论文：
Random-Walk Computation of Similarities between Nodes of a Graph with Application to Collaborative Recommendation

上面仅仅列举了graph model中最经典的一些算法，如果深入研究这些论文，可以对graph model有个大概的认识。