GraphSAGE：大规模图学习的归纳方法

需积分: 0 146 浏览量更新于2024-08-05 1 收藏 942KB PDF 举报

"本文主要分析了GraphSAGE算法的基本原理，它是针对GCN在大规模图学习中的局限性提出的一种inductive learning解决方案。GraphSAGE不直接学习所有节点的embedding，而是学习一种聚合邻居节点特征的方法，能快速适应新节点的表示。文章中提到，GCN在transductive learning中的问题在于节点表示相互依赖且参数与邻接矩阵紧密关联，这限制了其在新节点或子图上的泛化能力。" 在图神经网络领域，GraphSAGE是一个重要的突破，由Hamilton等人在2017年提出。它解决了Graph Convolutional Networks (GCN) 在大规模图数据上难以进行inductive learning的问题。GCN虽然在节点分类、链接预测等任务中表现出色，但由于其transductive nature，无法泛化到训练集中未出现的新节点。 GraphSAGE的核心思想是采样和聚合策略。它并不尝试为图中的每一个节点单独训练一个embedding向量，而是学习一组aggregator functions，这些函数负责从节点的局部邻居中聚合特征信息。这个过程可以按层次进行，每个层次代表不同的“跳”或“搜索深度”，使得节点能够获取更远邻居的信息。采样机制则用于控制计算复杂性，因为直接考虑所有邻居对于大规模图是不可行的。在训练过程中，GraphSAGE首先对每个节点的邻居进行采样，然后应用聚合函数将这些邻居的特征信息整合到当前节点的特征表示中。这一过程在多层中重复，使得节点的表示不仅包含自身的特征，还包含了多级邻居的信息。在测试阶段，对于未在训练集中出现的新节点，可以直接利用学习到的聚合函数生成其embedding，无需重新训练模型。 GraphSAGE提供了不同类型的聚合函数，如Mean Aggregator，LSTM Aggregator和Pooling Aggregator，它们分别对应于平均池化、循环神经网络处理邻居特征和最大池化的聚合方式。这些不同类型的聚合器为模型提供了灵活性，可以根据任务需求选择合适的方法。总结来说，GraphSAGE通过采样和聚合策略克服了GCN的局限性，实现了对大规模图的inductive learning，能够在不重新训练的情况下对新节点进行有效的表示学习。这一方法在图数据的实时更新和扩展场景中具有显著优势，为图神经网络的应用开辟了新的可能性。

GraphSAGE原理浅析

【参考文献】

GraphSAGE

GraphSAGE: GCN落地必读论文

GRAPH SAGE(SAMPLE AND AGGREGATE) : INDUCTIVE LEARNING ON GRAPHS

简单代码实现参考：

https://github.com/dsgiitr/graph_nets/blob/master/GraphSAGE/GraphSAGE_Code+Blog.ipynb

1. GCN的不足

在大规模图上学习节点embedding，在很多任务中非常有效，如学习节点拓扑结构的 DeepWalk 以及同

时学习邻居特征和拓扑结构的GCN。

GCN的不足之处在于，它是一种transductive learning的范式，无法泛化到新的未见过的节点或者其

他子图上，原因在于：

GCN中每个节点的表示都是受到其他节点的影响，因此添加一个节点，意味着许许多多与之相关的

节点的表示都应该调整。

GCN的参数学习与邻接矩阵直接相关，是的size，若是有新的节点加入，图的结构会发生变

化，邻接矩阵的大小也将发生改变，整个weight就需要重新训练。

为了不重新训练而快速得到新节点的表示，GraphSAGE（Graph SAmple and aggreGatE）采用

inductive learning的学习范式。

GCN等是直接学习到node embedding的，而GraphSAGE学习的则是一种聚合邻接节点特征的方式（聚

合函数），当需要泛化到新的节点上时，这种学习到的聚合方式就可以直接应用，从而得到新节点的

node embedding。

2. GraphSAGE框架

GraphSAGE的核心：GraphSAGE不是试图学习一个图上所有node的embedding，而是学习一个为每

个node产生embedding的映射。

文中不是对每个顶点都训练一个单独的embeddding向量，而是训练了一组aggregator functions，这些

函数学习如何从一个顶点的局部邻居聚合特征信息（见下图）。每个聚合函数从一个顶点的不同的hops

或者说不同的搜索深度聚合信息。测试或是推断的时候，使用训练好的系统，通过学习到的聚合函数来

对完全未见过的顶点生成embedding。

GraphSAGE的整体流程如下：

下载后可阅读完整内容，剩余3页未读，立即下载

仙夜子

粉丝: 45

GraphSAGE：大规模图学习的归纳方法

graphsage-simple:适用代码测试，源代码地址：https

MySQL JOIN 工作原理浅析1

java 虚拟机原理浅析

室内定位原理浅析

Weex工作原理浅析

vue实现原理浅析

Struts1工作原理浅析.doc

代码生成原理浅析PPT

指纹锁技术原理浅析

WPF换肤设计原理浅析

最新资源