【2020顶会KDD】用于属性图嵌入的自适应图形编码器

题目:Adaptive Graph Encoder for Attributed Graph Embedding

 

文章作者信息:

 

预览摘要:

属性图嵌入是一项具有挑战性的图分析任务,它从图的拓扑结构和节点特征中学习向量表示。近年来,基于图卷积网络(GCNs)的方法在这方面取得了很大的进展。

然而,现有的基于GCN的方法主要有以下三个缺点:

首先,实验表明,图卷积中的滤波器和权值矩阵的纠缠会影响模型的性能和鲁棒性;

其次,这些方法中的图卷积滤波器是广义拉普拉斯平滑滤波器的特殊情况,它们不能保持最优低通特性;

最后,现有算法的训练目标通常是恢复邻接矩阵或特征矩阵,这与实际应用并不总是一致的。

为了解决这些问题,文中提出了自适应图编码器(AGE),一种新的属性图嵌入框架。AGE由两个模块组成:

(1)为了更好的缓解节点特征中的高频噪声带来的影响,AGE采用了精心设计的拉普拉斯平滑滤波器;

(2) AGE采用自适应编码器,迭代地增强过滤后的特性,以实现更好的节点嵌入。

文中使用四个公共基准数据集进行实验,以验证ACE在节点聚类和链路预测任务上的有效性。实验结果表明,在这些任务中,AGE始终优于最新的图形嵌入方法。

 

主要贡献:

本篇文章的主要贡献可以总结为以下三点:

(1)分析:文章从图形信号平滑和拉普拉斯平滑的角度详细分析了图卷积滤波器的机制。该分析有助于设计合适的拉普拉斯平滑滤波器,以更好地缓解高频噪声。

(2)模型:提出了ACE,一个属性图嵌入的一般模型。该模型分离了过滤器和权值矩阵。并选取了更合适的滤波器来保持最优的低通特性。此外,文章还采用了一种新的自适应学习策略来训练节点嵌入,而不是重建损失。

(3)实验:使用真实的基准数据集对节点聚类和链路预测任务进行了的实验。结果表明,AGE优于最先进的属性图嵌入方法。

 

模型结构:

 

先前的模型:

先前工作中,主要包含一个GCN编码器和一个重构解码器(如图1所示)。而一个GCN编码器中又包含多个图卷积层,每层又包含一个图卷积滤波器,一个权重矩阵和一个激活函数。这样的模型结构具有以下缺点:

(1)滤波器和权值矩阵的纠缠不会带来模型性能的提升,甚至有可能会损害其实际表现;

(2)利用拉普拉斯平滑过滤器可以进行特征矩阵的低通去噪,但其并不是最优的低通过滤器;

(3)重构邻接矩阵等价于求邻接矩阵与真值之间的相似性;恢复特诊矩阵则强制要求模型记住特征中的高频噪声,这两种任务都不符合实际。

 

本文的模型:

本文提出的框架。在原始特征矩阵X上执行t-1层拉普拉斯平滑获得平滑特性矩阵。然后通过自适应编码器对嵌入的节点进行编码,该编码器采用自适应学习策略:(1)计算节点间相似度矩阵。(2)选择高置信度的正训练样本和负训练样本(红绿方格)。(3)通过监督损失对编码器进行训练。

 

实验结果:

 

节点聚类实验效果:

 

控制实验:

 

链路预测实验效果:

 

特征值分布及超参数k的影响:

 

可视化聚类效果:

 

结论:

本文提出了一种统一的无监督图表示学习模型AGE。从图信号平滑的角度研究了图信号的卷积运算,并设计了一种保持最佳去噪特性的非参数化的拉普拉斯平滑滤波器来滤除高频噪声。在编码器部分,我们发现自适应学习更适合嵌入。在标准baseline上的实验表明,我们的模型优于最先进的基线算法。对于未来的工作,一个有趣的方向是通过避免对相似度矩阵的完整计算来提高自适应学习的计算效率。

更多相关专业文章,欢迎关注公众号!

猜你喜欢

转载自blog.csdn.net/huang_shao1/article/details/108475076