互惠分布对齐：半监督学习的解决方案

182 浏览量更新于2024-06-19 收藏 855KB PDF 举报

"本文主要介绍了互惠分布对齐（RDA）方法，这是一种用于解决半监督学习（SSL）中不匹配分布问题的框架。RDA旨在处理标记和未标记数据之间类分布不一致的情况，以提高SSL方法的性能。通过强制两个分类器的预测分布进行相互对齐，RDA能够利用未标记数据的互补信息，即使在没有先验类分布知识的情况下也能进行有效正则化。此外，作者理论上证明了RDA最大化了输入输出的互信息。RDA在各种SSL设置和不匹配分布情况下表现出良好的性能，并且代码已在GitHub上公开。关键词包括分布对齐、不匹配分布，文章还讨论了SSL中的伪标记和置信度阈值等概念。" 在半监督学习中，由于标记数据通常有限，未标记数据的利用至关重要。传统的SSL方法，如基于置信度的伪标记，通过生成硬标签来最小化熵，例如FixMatch，它通过设置置信度阈值来筛选高质量的伪标签。然而，这样的方法依然存在风险，即模型可能产生噪声伪标签。为了解决这个问题，RDA（稳健半监督学习）被提出，它不再依赖超参数或置信度阈值，而是采用两种分类器预测的分布进行相互对齐，即预测的伪标签分布和复杂标签分布。这两种分布携带不同的信息，可以互相正则化，从而避免因类分布不匹配而导致的性能下降。 RDA的核心思想是通过分布对齐策略来处理不匹配的类分布，这种方法不仅适用于传统匹配的SSL设置，也适用于分布不匹配的场景。理论分析揭示了RDA在优化过程中实际上最大化了输入输出的互信息，这有助于学习更有代表性的表示。实验结果证明，RDA在多种SSL情境下，特别是在处理不匹配分布时，能显著提升学习性能。互惠分布对齐为半监督学习提供了一种新的、有效的解决方案，特别是在面临数据分布不一致的挑战时。它通过利用未标记数据的丰富信息，提高了模型的学习能力和泛化能力，对于推动SSL领域的进展具有重要意义。研究者可以通过提供的GitHub链接获取RDA的实现代码，进一步研究和应用这一方法。

+v：mala2255获取更多论

文

∈ U

U C C ∈

C 公

司简介

RDA：稳健SSL 5

简而言之，分布对齐的目标是最大化预测和输入数据之间的互信

息，

即

，输入输出互信息[5，3].将输入数据表示为

，将x的类预测

表

示

为

，将预测的类分布表示为

（

），我们可以将这个目标形式

化为：

（

;

）

H（

[

（

）]）

−

[

H（

（

））]

、

（1）

其中H（·）是指熵。具体来说，分布对齐的目标是最大化项（

[

（

y x

）]）。然而，

[3]

和

[39]中这种技术的实现

都是基于一个理想化的假

设：

“

标记和未标记的数据属于同一分布

”

。

更现实的是，我们不能保证标记数据

的分布与未标记数据的分布相匹配。这种不匹配的分布可能导致[3，

39]中的分布对齐失败，甚至不利于

模型对未标记数据的预测

。在这项

工作中，我们提出了互惠分布对齐没有匹配分布的假设和任何先验信

息的标记数据分布。

方法

在本节中，我们讨论了SSL中不匹配分布的设置，并提出了一种新的SSL

算法，称为Reciprocal Distribution Alignment（RDA），无需额外的超参

数，以改善SSL各种场景中的伪标记。此外，我们从理论上分析了我们的

方法的有效性。

3.1 SSL中的匹配和不匹配分布

在半监督学习中，我们将训练集划分为标记部分 X和未标记部分U。我

们将X的类分布记为Cx

，

将的类分布记为

。注意

在训练中是不可接

近的。给定

和对应的标签

和未标记的数据

，我们可以将SSL算法

视为以下优化任务：

minL =L

sup

（

，

;

）+L

unsup

（

;

）

，

（2）

其中

是模型的参数，L

sup

是标记数据的监督损失，L

unsup

是未标记数

据的无监督损失。最近的基于伪标记的SSL方法试图将未知的u标记归

为

unsup

。因此，伪标签的准确性成为重中之重。在传统的SSL设置中，

我们假设C

。在这个假设下，我们可以使用

通过分布对齐来指导u

的预测[3，26]，可以提高基于一致性或基于伪标记的方法的性能

[3，33，26，12]。不幸的是，这种假设过于不切实际和理想化。更符

合实际情况的是

，在SSL中称为

不匹配分布

。与传统的SSL不同，在

不匹配的分布中，模型从

学习到的分布不同于

，因此它不能正确预

测伪标签。换句话说，分配差距

剩余21页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

互惠分布对齐：半监督学习的解决方案

互惠太空：探索互惠空间的工具

论文研究 - 重复情感游戏实验中的互惠性：基于博弈论的计量经济学模型的分析

Linkers:互惠链接-开源

衡量互惠：调查和实验数据相关吗？-研究论文

愤怒的借款人：金融市场中的负面互惠-研究论文

加强互惠

seekx:互惠互利的协会缔造者

行为博弈与互惠：解决管理者时限问题的五维策略

交叉扩散互惠共存系统：定态分歧与稳定性分析

机构投资者与大股东互惠效应实验：投资决策影响揭示

最新资源