类增量式新类发现：预训练模型与知识蒸馏的应用

175 浏览量更新于2024-06-19 收藏 2.36MB PDF 举报

"类增量式新类发现：基于预训练模型的未标记数据集中新类别的发现与基类特征原型和特征级知识蒸馏的联合利用" 类增量式新类发现（Class-Incremental New Class Discovery, class-iNCD）是一项针对深度学习模型的研究任务，旨在在未标记数据集中发现新类别，同时保持对已知基本类别的识别能力。这项工作受到增量学习方法的启发，特别是基于排练的增量学习策略，目的是防止模型在学习新知识时遗忘旧信息。传统的机器学习和深度学习模型通常在有标签的数据集上进行训练，但这种方法在现实世界的应用中存在局限性，因为获取大量标注数据往往既昂贵又耗时。相反，类iNCD任务尝试利用预训练模型，这些模型已经在不相交但相关的标记数据集上进行了训练，以适应不断变化和扩展的类别空间。类iNCD方法的核心在于联合使用基类特征原型和特征级知识蒸馏。特征原型是每个基本类别的代表性特征向量，它们捕获了类别的关键特性。而特征级知识蒸馏则是将预训练模型的原有知识转移到新任务的过程，以保持对旧类别识别的准确性。此外，文中还提出了一个自我训练的聚类策略，这有助于同时识别新类别和区分原有的基础类别，以及构建一个联合分类器，以应对类增量设置中的挑战。为了评估类iNCD的有效性，研究人员在多个常见的基准数据集上进行了实验，并且结果显示，这种方法显著优于当前的最先进的技术。这表明类iNCD不仅能有效发现新类别，还能在不断学习新知识的过程中保持对已有知识的稳定性。新类发现（NCD）作为一个研究领域，其目标是模拟人类的无监督学习能力，能够在已经学习到某些模式后，自动发现和理解新的概念。NCD的重要性在于，它能够在不需要大量未标记数据的情况下，帮助模型扩展其分类能力，这对于实际应用，如图像识别、文本分类等，具有极大的价值。类增量式新类发现是深度学习和人工智能领域的一个重要进展，它结合了预训练模型的强大学习能力、无监督学习的灵活性以及增量学习的记忆保持机制，以适应不断变化的环境和任务需求。通过这种方式，模型能够持续学习并适应新出现的类别，从而更好地服务于现实世界的复杂场景。

+v：mala2255获取更多论

文

不

X → Y

∈ {X <$X}

X → Y

→ Y

不

类增量新类发现5

所有类别

新班

所有类别

前

累积=100%

不合理

匈牙利语作业测验

(a)

（b）与任务无关的评价

图二

评价方案比较（a）iNCD中任务特定头部的评价[29]和（b）我们班iNCD中任务

不可知头部的评价。

在前一个任务中仍然表现良好

[L]

。换句话说，我们感兴趣的是学习

单个映射函数

：

[L][U]

，该函数可用于推断

任何测试图像x的标签

[L] [U]

.这与现有的NCD方法形成鲜明对

比，其中

对[L]

的性能不感兴趣。

评价方案

。在NCD方法[11，36]中，分别为旧类和新类

训练任务特定的

头部。这造成了限制，因为它们只能在特定任务的NCD设置中操作为了

解决这个问题，ResTune [29]在推理过程中使用新旧头部的连接类增量

性能通过匈牙利分配（HA）[25]将此问题视为聚类任务来估计。然而，

这种评估协议在类iNCD中确实是不合适的，因为它没有显式地区分新

旧类。如图2（a）所示，分类器将旧类的样本识别为新类（反之亦

然），但HA获得的准确度

仍然是100%，使得[29]中的评价不公平。

在这项工作中，我们学习了一个任务不可知的头（或

联合

头），

并提出了一个新的评估协议类iNCD（见图）。2（b））。具体来说，

我们首先使用新的

头部

来估计来自新类的未标记数据的预测。我们利

用HA [25]仅根据新类的预测和地面实况标签重新分配地面实况ID。

联合（任务不可知）分类器用于评估新的类测试样本，直接比较预测

与这些重新分配的地面实况标签。而对于旧类的测试数据，我们使用

旧类的地面实况进行评估。如图2（b）所示，我们的评估协议明确区

分了旧类和新很明显，我们的评估比[29]更合理，并且当新类被分类

为旧类时会惩罚度量，这是一种理想的行为。

总体框架

。在增量学习

设置中，我们提出的FRoST（见图1）。（3）分两个阶段进行在第一

阶段中，我们以监督的方式在标记的数据集

[L]上

学习映射函数

[L]

：[L]

[L]，该标记的数据集[L]可以识别属于第一

[L]

个类别的样本。我们用一

个神经网络对函数

[L]

进行建模，该神经网络进一步由两个子网络组

成：特征提取器

（·）和输出C

[L]

logits的线性分类器

[L]

（·），例如

当提到类时，我们认为旧的基础;和，新的小说互换。

康卡特角

3 2

GT ID

新掌门

0 1 集群

预

2 3

R-GT

GT+2

是

旧类

预

R-GT

匈牙利分配

加速度

=0%

基于聚类

直接比较

测试

联合首长

上一篇：预测

GT：Ground Truth

R-GT：重新分配的GT

旧0 1

新2 3

剩余22页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

类增量式新类发现：预训练模型与知识蒸馏的应用

按以下描述和要求建立两个类：基类 Rectangle（矩形类） 和派生类 Cube（正方体）

数据类型的基类

C#基础知识 基类Object

c++派生类和基类的关系和作用

对基类和派生类的关系描述中，错误的是( ) A.派生类是基类的具体化 B.基类继承了派生类的属性 C.派生类是基类定义的延续 D.派生类是基类的特殊化

C++ 派生类指针转基类指针，基类数据发生变化

基类指针指向派生类对象和派生类指针指向基类

C++基类和派生类是什么关系

最新资源

按以下描述和要求建立两个类：基类 Rectangle（矩形类）和派生类 Cube（正方体）

C#基础知识基类Object