开放世界半监督学习：OpenLDN新方法发现未知类别

175 浏览量更新于2024-06-19 收藏 1.75MB PDF 举报

"OpenLDN: 开放世界半监督学习中利用相似性损失发现新类的方法" 在当前的深度学习领域，监督学习虽然取得了显著的进步，但依赖大量标注数据的局限性催生了半监督学习（SSL）的研究。SSL旨在通过利用少量标注数据与大量未标注数据来提升模型的性能。然而，传统SSL方法往往假设标记和未标记数据源于同一分布，这在开放世界设定下并不成立，因为未知的新类别可能存在于未标注数据中。开放世界半监督学习（Open-world SSL）则试图克服这一局限，不仅要识别已知类别的样本，还要检测并聚类出属于未标记数据中的新类别。OpenLDN（Open-set Learning with Distance-basedNovel Class Discovery）是为此目的提出的一种新方法。它采用成对的相似性损失来挖掘新类别的信号。通过双层优化策略，OpenLDN利用标记数据的信息隐式地对新类样本进行聚类，同时保持对已知类别的识别。一旦新类别被发现，OpenLDN将开放世界SSL问题转化为标准SSL问题，进一步利用现有SSL技术提升性能。 OpenLDN的工作流程包括以下几个关键步骤： 1. 利用成对相似性损失函数：这种损失函数通过比较未标记样本间的相似性，帮助识别可能属于新类别的样本。 2. 双层优化规则：这一规则确保了新类别的发现与已知类别的识别之间的平衡，避免误判。 3. 新类别检测与聚类：通过分析未标记数据的相似性，OpenLDN能够检测到新类别并将其聚类，从而为后续处理提供结构化的信息。 4. 转换为标准SSL问题：在新类别被识别后，OpenLDN将剩余的未标注样本视为已知类别的一部分，应用标准的SSL技术进行进一步学习。实验结果表明，OpenLDN在多个分类基准上超越了当前最先进的方法，证明了其在开放世界环境下的有效性。此外，该研究提供了开源代码（https://github.com/nayeemrizve/OpenLDN），促进社区对该方法的复现和扩展。关键词：开放世界，半监督学习，新类，深度学习，相似性损失，聚类这篇论文不仅介绍了OpenLDN算法的原理，还探讨了在现实世界场景中遇到的挑战，特别是在数据分布不一致的情况下的学习问题。通过对现有SSL方法的扩展，OpenLDN展示了在开放世界设置下处理新类别的潜力，为未来研究提供了新的方向。

+v：mala2255获取更多论

文

›→

∈

组带标记

向后：交叉熵损

失

熵正则化

余弦相似度

成对相似性损失

未标记集

向后：（双层优化）

OpenLDN：学习发现开放世界SSL 5的

图1：

OpenLDN

概述

学习发现新类别：将

一组标记和

未标记的图像提供给特征提

取器

以获得特征嵌入。嵌入被传递到分类器f

以获得输出概率。我们

从一

批中每个可能对的输出概率中计算成对余弦相似性得分

。并行地，成对相似性

预测网络

也

基于成对的特征嵌入输出相似性分数。然后，我们计算成对的相似

性损失（等式2）。（2）促进新课程的发现。我们还计算交叉熵（CE）损失

（等式10）。6）和熵正则化损失（等式6）。7）通过分别从标记和伪标记样本

学习并避免平凡解来补充成对相似性损失。接下来，我们更新

和

的参数以

最小化总体损失。然后，我们仅使用具有更新的

和f

的标记样本来计算

损失

。最

后，我们利用双层优化规则来基于该CE损失来更新f ε（等式2）。4）。双层优

化规则有助于通过将特征相似性从已知类转移到未知类来优化特征。

3.2

学习发现新课程

为了发现新的类，OpenLDN利用用

参数化的神经网络

作为特征提

取器。特征提取器通过将输入图像x投影到嵌入空间

中来生成特征

嵌入，即，

：

X Z

。这里，

和

分别是输入图像和特征嵌入的集合

接下来，为了识别来自新类别的样本，以及对来自已知类别的样本进

行分类，我们应用分类器

，用Φ参数化

。

该分类器将嵌入向量

投

影

到输出分类空间

：

<$→

中

。在这个输出空间中，第一个

logits对应于已知的类，其余的

logits属于新的类。利用

softmax激活

函数，从这些输出得分中得到softmax

概率

得分y

∈

Rcl

，

即

. ，

Softmax

（

））。

我们的总体目标是在识别已知类的同时发现新类，这包括三个损

失：a）成对相似性损失

对

，b）交叉熵（CE）损失

，以及c）熵正

则化项

reg

。成对相似性损失有助于网络发现新的类，而CE损失有助

于通过利用地面真值标签和生成的伪标签对已知类和新类进行分类，

而熵正则化有助于避免无效解。

+v：mala2255获取更多论

文

是

的

◦

6米。N. Rizve等人

发现新类别的总体目标函数如下：

nov

pair

reg

。

（一）

在使用

nov

进行训练之后，分配给最后一个

中的任何一个的样本

logit被认为是新的类样本。

成对相似性损失：

发现新的类是我们提出的方法的核心组成部分

，这是一

个无监督的聚类问题，可以表示为成对相似性预测任务[11，73]。特

别地，在一对图像之间关于聚类只能存在两种可能的关系，它们要么

属于同一聚类，要么不属于同一聚类。然而，为了解决成对相似性预

测任务的监督是必要的。以前的方法[7，25]试图通过基于预先训练的

特征找到最近的邻居（标记为同一聚类的成员）来为所有图像对生成

成对的伪标签来克服这个问题然而，这样的方法是计算昂贵的，并遭

受噪声估计最近的邻居。

与这种方法形成鲜明对比的是，我们不是依靠无监督/自监督预训

练来获得成对相似性预测任务的标签，而是学习基于更可靠的可用地

面实况注释来估计成对相似性得分。为此，我们引入了一个成对相似

性预测网络，

，

参数

为

。给定一对嵌入向量，

输出

成对相似性得分，

即，

∈

：

Z<$→

，

1]. 来自

的成对相似性得分可以用作用于最小

化成对相似性损失的监督为此，给定一批图像，我们计算所有图像对

之间的输出概率的余弦相似性。在此之后，对于我们的成对相似性损

失，我们最小化输出概率的计算余弦相似性得分和来自

的估计成对

相似性得分之间

的

损失。请注意，最小化输出概率的余弦相似性的

成对相似性损失是至关重要的，因为这将隐含地导致基于最大概率得

分的聚类的形成，从而识别新的类别。成对相似性损失如下：

对

Sim

（

）

，

：

，

：

）−

∈

（Z

，

：

，

：

）

，

（

二

更

）

其中，

是

输出

概率

矩阵，

是

特征

矩阵

，

Sim（

，

表示余弦相似性

函数。

为了优化

滤波

器

的参数，我们设计了一个双层优化过程[3]。由于我

们无法访问任何未标记样本的标签，特别是来自新类别的样本，因此

我们使用属于已知类别的标记样本这种双层优化背后的主要动机是获

得一组参数，其不降低

在已知类别上的性能。因此，我们基于标

记示例上计算的交叉熵损失来优化

？

优化过程如下：

首先，我们更新的特征提取器和分类器的参数与方程中引入的组

合损失。1、发现新的类。

（

，

）

（

，

）

−

（

，

）

（

，

）

no v

（

，

）

（三）

剩余25页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

开放世界半监督学习：OpenLDN新方法发现未知类别

一种新的基于相似度的目标跟踪算法

半监督学习：局部与全局一致性新方法

无监督轨道异物检测：相似性度量学习新方法

无监督学习：模式识别中的发现与应用

提升半监督学习效率：基于图的聚类与主动学习方法

2008年Xiaojin Zhu的半监督学习综述：关键方法与进展

利用RSSS提升图像分类器性能的半监督学习方法

图自监督学习：2021年全面指南

无监督学习：探索数据中的隐藏模式

图神经网络自监督学习：一份综合综述

最新资源