无监督属性图嵌入:基于节点相似度的新方法

需积分: 11 0 下载量 101 浏览量 更新于2024-08-04 收藏 864KB PDF 举报
"该资源是一篇发表在《计算机应用》期刊上的学术文章,由李扬、吴安彪、袁野等人撰写,主要讨论了基于节点相似度的无监督属性图嵌入模型。文章介绍了如何在无需大量标注数据的情况下,利用无监督学习方法处理属性图的嵌入问题,以保留节点的拓扑结构和属性信息。文中提出了一个新的无监督算法,通过图卷积网络(GCN)优化节点嵌入向量,提高了节点分类的准确性。" 正文: 在计算机科学领域,属性图嵌入是研究热点之一,它致力于将复杂的属性图中的节点转化为低维向量表示,以便于分析和操作。属性图是一种包含节点、边以及节点和边属性的数据结构,广泛存在于社交网络、生物信息学、知识图谱等众多场景。传统的图嵌入方法往往侧重于无属性的图,而属性图的嵌入则需要同时考虑拓扑结构和节点的属性信息。 该文章针对有监督或半监督属性图嵌入算法面临的挑战,即需要大量标注数据的问题,提出了一种无监督的解决方案。在无监督学习中,模型训练无需依赖于预先标记的样本,这降低了数据准备的复杂性和成本。作者首先利用现有的无属性图嵌入算法来捕获节点的拓扑信息,然后结合属性图的节点属性信息,通过图卷积网络(GCN)进行深度学习,生成节点的嵌入向量。 GCN是一种在图结构数据上进行深度学习的有效方法,它通过在图的邻接矩阵上进行卷积操作,将节点的邻居信息融合到其表示中。在这个过程中,GCN允许节点特征在图的邻域内传播,从而获得更丰富的上下文信息。在属性图嵌入模型中,GCN被用来同时学习拓扑和属性信息的联合表示。 为了确保生成的嵌入向量能捕捉到拓扑和属性的相似性,作者提出了一种优化策略,使得嵌入向量与拓扑信息和属性信息的差异最小化。这种方法促进了拓扑相似且属性相似的节点在嵌入空间中也保持相似,从而增强模型的预测性能。 在实验部分,该模型在Cora和Citeseer这两个标准数据集上进行了节点分类任务的对比测试,结果显示相比于图自动编码器(GAE)方法,提出的无监督属性图嵌入模型在分类准确率上有显著提升,分别提升了1.2个百分点和2.4个百分点。这验证了新方法在保持节点拓扑和属性信息的同时,能够生成高质量的嵌入向量,对于节点分类等任务具有更高的效率和准确性。 该研究提供了一种新的无监督属性图嵌入方法,它有效地解决了传统有监督或半监督方法的局限性,并在实践中展现出良好的性能。这对于处理大规模、复杂属性图的机器学习任务,特别是在数据标注困难的情况下,有着重要的理论价值和实际应用前景。