李宏毅机器学习课程笔记-8.2图神经网络(Spatial-based Convolution)

术语（Terminology）

Aggregation

Aggregation是Convolution在GNN中的推广。Aggregation就是在某一个layer中用某node及其neighbor的feature得到下一个layer中该node的feature。
Readout

Readout有点像是全连接在GNN中的推广。Readout就是汇总整个图的信息，最终得到一个特征来表示这整个图（Graph Representation）。

输入层

假如是一个化学分子，输入层的图中的结点就是一个原子。不同原子有不同的特征，其特征可以是任何和原子相关的化学特征，所以需要embedding（将高维特征映射到低维特征），做完embedding也就得到了隐藏层(h^0)。
隐藏层(h^0)

如何做embedding呢？让原特征乘以embedding matrix就得到隐藏层(h^0)。如下图所示，以1个结点为例，输入层中结点(v_3)的特征是(x_3)，该结点embedding时的计算式为(h^0_3=ar w_0cdot x_3)。embedding后就得到了隐藏层(h^0)，然后再对隐藏层(h^0)进行Aggregation就得到了隐藏层(h^1)。
隐藏层(h^1)

如何做Aggregation呢？如下图所示，以1个结点为例，在隐藏层(h^0)中，结点(h^0_3)和$h^0_0,h0_2,h^{0_4$3个结点相邻，则Aggregation时计算式为$h}1_3=hat w_{1,0}(h^0_0+h0_2+h^0_4)+ar w_1cdot x_3$。经过多次Aggregation，最后需要Readout。
Readout

如何做Readout呢？如下图所示，假设有3个隐藏层，那Readout的计算式为(y=MEAN(h^0)+MEAN(h^1)+MEAN(h^2))。

输入层

假如我们有1个和上例中（NN4G）一样的输入图。
隐藏层(h^0)

如下图所示，从输入层到隐藏层(h^0)的计算式为(h^0_3=w^0_3MEAN(d(3,cdot)=1))，其中(d(3,cdot)=1)表示所有与结点(x_3)距离为1的输入层结点的特征。
隐藏层(h^1)

如下图所示，从隐藏层(h^0)到隐藏层(h^1)的计算式为(h^1_3=w^1_3MEAN(d(3,cdot)=2))，其中(d(3,cdot)=2)表示所有与结点(x_3)距离为2的输入层结点的特征。

以此类推，叠加k个隐藏层后就可以获取各结点k范围内的信息。如下图所示，令1个隐藏层中多个结点的特征形成矩阵（1行是1个结点的特征），多个隐藏层的特征就形成多个通道(H^0,H^1,dots,H^k)。
Node features

如何表达整个图的特征呢？如下图所示，将每个通道的特征flatten，然后再乘以参数(w)得到(y_1)即可。

也有其它做法，ICLR2018中DGC(Diffusion Graph Convolution)不是flatten，而是相加，如下图所示。