图学习Mixup：解决节点与图分类混淆问题的策略

97 浏览量更新于2024-06-19 收藏 1.06MB PDF 举报

"这篇文章主要探讨了在图学习中遇到的节点和图分类的混淆问题，并提出了一种名为Mixup的方法来解决这个问题。Mixup是一种数据增强技术，常用于图像分类，通过线性插值图像的特征和标签创建合成样本。然而，将其应用到图学习上存在困难，因为图数据的结构复杂且具有连通性。" 文章中提到，为了解决图数据的不规则性和连通性问题，研究者提出了两个分支的图卷积来混合节点的感受野子图，以便进行节点和图的插值。然而，由于节点间的相互连接可能导致混淆，研究者进一步设计了一个两阶段的Mixup框架。在这个框架中，首先进行Mixup操作的图卷积，然后再利用每个节点的邻居表示，以此减少不同节点对之间的干扰。针对图分类任务，研究者在语义空间中插入复杂的多样性图，以增强模型的学习能力。他们认为，这种方法有助于图神经网络（GNN）学习更多判别性特征，减少过拟合现象。实验结果证明，他们的Mixup方法在标准数据集上提升了节点和图分类的测试准确度和F1-微分值，从而证实了该方法的有效性。此外，此方法的一个显著优点是它能正则化流行图神经网络，提高其泛化性能，同时并未增加计算时间复杂度。这表明，Mixup在图学习领域具有广阔的应用前景，尤其是在处理大规模复杂网络数据时。本文的关键词包括数据扩充、节点分类、图分类等，暗示了研究的核心集中在如何利用Mixup技术提升图学习任务的性能。研究者们保留了在适当署名的情况下在个人和公司网站上分享作品的权利，遵循知识共享署名4.0国际许可协议。这项研究为图学习提供了新的视角，通过创新的数据增强策略改进了节点和图分类的准确性，同时也为图神经网络的优化和泛化能力提升提供了一种有效途径。

节点和图分类

WWW

3665

∈

[]

（）（）

（V E）V

（

{

}

）

∈

（）

∈

在样本大小上，从而限制小批量计算的

复杂度。

[8]

通过在前一

层中仅需要两个支持节点来而不是采样层，

QuanterGCN [10]

和

GraphSAINT [65]

从子图构建小批量，以避免

我们的工作与上面两条线正交，因为它没有改变

GNN

架构，

也没有引入小批量技术。相反，我们提出了一种新的方法，可以正

则化

GNN

模型，通过增强图形

数据来提高其有效性。

DropEdge [40]

是图形数据增强的开创性工作

。

DropEdge

假设节点

的类标签

在边缘删除后没有改变，因此需要使用领域知识。相比之

下，我们的

mixup

不需要在给定增强特征的情况下保持地面实况

标签不变，并且

通过结合

特征插值应该导致相关目标插值的先验知

识来扩展训练分布

[67]

。我们发现，我们的

Mixup

方法提供的模型正则

化的有利特征导致更准确

的预测。

图形分类。

图分类的早期解决方案包括图核。开创性的工作

[24]

将

图分解

为小的子图，并根据

它们的成对相似性计算核函数。随后

的工作提出了各种子

图，如路径[3]和子树[44]，[36]。最近，人

们已经做出了许多努力来设计用于图分类的图神经网络

（

GNN

）

[42]

，

[32]

，

[37]

，

[19]

，

[63]

，

[69]

，

[60]

。

一些工作

提出了图池化方法来总结节点表示[60]，[53]，[30]，[26]，

[25]，[17]，[12]。 [29]的作者提供了局部池化和节点

注意机制

的统一视图，并研究了池化方法推广到更大和噪声图的能力。在

[9]

中，作者报告说，线性卷积滤波器后跟非线性集函数实现了有

竞争力的性能。这些工作的重点是开发更高复杂度的

GNN

结构，

以提高其拟合能力。相比之下，我们的框架与它们正交，因为我

们提出了一种新的数据增强方法，该方法通过内插所有类的图来增

强

GNN

模型，

以扩大对训练分布的支持。

数据扩充。数据增强在训练神经网络中起着核心作用。它对输

入数据进行操作，显著

提高了性能。例如，在图像分类中，

策略（如水平翻转、随机擦除

[70]、隐藏和查找[46]和剪切

[14]）已被证明可以

提高性能。在

MNIST

上，跨尺度、位置和方

向的弹性变形已被应用于实现令人印象深刻的

结果[41]，[11]，

[45]，[54]。 Mixup [67]，[52]是一种用于图像分类的特别有效

的增强方法，其中神经网络在图像

及其相应标签的凸组合上进行训

练。我们设计了用于图学习的

Mixup

方法

，为此，我们提出了两

个分支图

卷积和两个阶段的

Mixup

框架来处理图数据的不规则性

和连通性。与为图形数据设计的现有数据增强技术

[40]

，

[57]

，

[58]

不同，这些技术要求在数据增强后地面真实标签保持不变，我

们的方法是数据集独立的，并且不需要

使用领域知识。我们的

Mixup

方法模拟了

图2：（左）通常，GNN层通过聚合其邻居和自身的表示来

更新节点的（红色）表示。（右）我们提出了双分支图卷积

来混合节点的属性和它们的拓扑。对于要混合的一对节点

（红色和蓝色），我们首先混合它们的属性。然后在每一

层，我们分别在对应于成对节点（红色和蓝色）的图拓扑的

两个分支中进行图卷积，并在下一层之前混合来自两个分支

的聚合表示。

不同类的节点或图之间的邻近关系，这使得

GNN

能够学习更好

的表示安排

3 方法

我们插入一对节点

图以及它们的地面真实

标签，以产生一个新

的合成样本进行训练。为了

混合高度不规则的图拓扑，我们提出

了双分支混合图卷积（见图

（

））。此外，为了协调同一小批

量中不同节点的

Mixup

，我们设计了一个两阶段框架，该框架利

用在

Mixup

之前学习的表示（见图

）。

）。最后，我们在语义

嵌入空间中对复杂多样的图进行插值，以实现图的分类。接下

来，我们将详细讨论

用于节点和图分类的Mixup方法。

3.1 背景和动机

Mixup

在

[67]

中首次提出用于图像分类。考虑

一对样本

，

和

，y

，其中x表示输入

特征，

表示独热类标签。混合产生合

成

样品，如（见图1）。1）、

x=λx

+（1−λ）x

，（1）

y=λy

+（1−λ）y

，（2）

其中λ0， 1. 通过这种方式，Mixup

通过合并先验知识来扩展训

练分布，即特征的插值应该导致相关标签的插值

[67]

。

Mixup

的

实

现随机选取一个图像，然后将

其与从同一小批量中绘制的另一个

图像配对。

在我们的工作中，我们专注于图学习中的两个基本任务

：节点

和图分类，前者旨在

学习将每个节点映射到预测类标签的映射

函数

，而后者将每个图映射到标签。我们将图定义为G=，，

其中表示节点集，并且

是边的集合节点

的输入属性向量为x

，节点

的邻域为

我

= J i、j .图

神经网络（

GNN

）是这两种情况的最先进的

解决方案

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

图学习Mixup：解决节点与图分类混淆问题的策略

BP神经网络分类问题解决方案（MATLAB）

宽度学习实现MNIST图像分类：MATLAB源码解析

人工智能在分类问题中的应用与算法探讨

混淆矩阵在文本分类问题中的应用研究

BERT文本分类的常见问题及解决方案：分类错误、过拟合等

PyTorch图神经网络实战速成：节点分类从入门到精通

随机森林：多分类预测问题的终极解决方案

XGBoost分类问题解决方案：业务挑战的实战破解之道

【深度学习性能评估】：神经网络中混淆矩阵的应用实践

核极限学习机应用于回归/分类问题，对比极限学习机

最新资源