图神经网络入门

拜读了Jure Leskovec的《Representation Learning on Networks》才明白图神经网络到底在学什么，是如何学的，不同GNN模型之间的关系是什么。总的来说，不同类型的模型都是在探讨如何利用图的节点信息去生成节点（图）的embedding表示。

图表示学习的两大主流思想

Node embedding

目标：编码节点使其在embedding空间的相似性近似为在原网络的相似性

可以看出，前两步是node embedding的核心。

第一个问题：如何映射节点到低维空间？

参考word2vec，借助embedding-lookup就可以

第二个问题：如何定义节点相似性？

考虑 k-hop 节点

上述方法的大致思想都是：

DeepWalk，Node2vec

图G：

如何表示节点

下面不同的GNN算法都是在探索如何利用邻域节点生成当前节点的embedding表示

GNN基础思想

[mathbf{h}_{v}^{k}=sigmaleft(mathbf{W}_{k} sum_{u in N(v)} frac{mathbf{h}_{u}^{k-1}}{|N(v)|}+mathbf{B}_{k} mathbf{h}_{v}^{k-1} ight) ]
GCN

[mathbf{h}_{v}^{k}=sigmaleft(mathbf{W}_{k} sum_{u in N(v) cup v} frac{mathbf{h}_{u}^{k-1}}{sqrt{|N(u)||N(v)|}} ight) ]
GraphSAGE

[mathbf{h}_{v}^{k}=sigmaleft(left[mathbf{W}_{k} cdot operatorname{AGG}left(left{mathbf{h}_{u}^{k-1}, forall u in N(v) ight} ight), mathbf{B}_{k} mathbf{h}_{v}^{k-1} ight] ight) ]
AGG函数可以定义为：
- Mean
  
  [mathrm{AGG}=sum_{u in N(v)} frac{mathbf{h}_{u}^{k-1}}{|N(v)|} ]
- Pool
  
  [mathrm{AGG}=sigmaleft(left{mathrm{Q} mathrm{h}_{u}^{k-1}, forall u in N(v) ight} ight) ]
- LSTM
  
  [mathrm{AGG}=mathrm{LSTM}left(left[mathbf{h}_{u}^{k-1}, forall u in pi(N(v)) ight] ight) ]
Gated Graph Neural Networks

[mathbf{m}_{v}^{k}=mathbf{W} sum_{u in N(v)} mathbf{h}_{u}^{k-1} ]
[mathbf{h}_{v}^{k}=operatorname{GRU}left(mathbf{h}_{v}^{k-1}, mathbf{m}_{v}^{k} ight) ]

上述方法都是nodel-level embeddings，如何embedding图？

以上内容仅是对图神经网络初步了解的学习，[1]非常适合入门GNN，推荐大家阅读，有问题欢迎交流。

[1] Jure Leskovec, 《Representation Learning on Networks》http://snap.stanford.edu/proj/embeddings-www/