处理损失噪声：弱监督多标签分类的新策略

版权申诉

160 浏览量更新于2024-08-06 收藏 438KB DOC 举报

"本文主要探讨了在弱监督多标签分类(WSML)中，损失问题对模型性能的影响，以及如何处理大损失样本以避免模型记忆噪声标签。文章提出了新的WSML方法，该方法在多个数据集上表现出优于现有最优方法的结果。" 在计算机视觉领域，弱监督多标签分类是一个关键问题，因为全面的标签注释往往过于昂贵。当前的WSML方法通常分为两类：一类只使用观察到的标签进行训练，另一类则假设未观察到的标签为负，但这种方法可能会引入噪声。本文作者注意到，第二种方法虽然可能包含更多的负面标签信息，但噪声标签的学习可能导致模型的记忆效应，即模型会逐渐记住错误的标签。作者通过研究发现，即使在多标签设置中，模型在训练过程中也会经历类似于有噪声的多类别分类中的记忆效应。具体表现为，干净标签（真负样本）的损失值在训练初期快速下降，而噪声标签（假负样本）的损失则在训练后期才开始降低。这一现象表明，噪声标签在训练过程中对模型的干扰比预期更大。针对这一问题，文章提出了三种策略来处理大损失样本，以防止模型过度依赖噪声标签。这些策略可能包括在训练过程中动态地拒绝高损失样本，或者采用修正机制来更新这些样本的标签，从而减少噪声对模型学习的影响。通过这些方法，提出的WSML框架能够在不增加大量计算负担的情况下，有效地利用部分标签信息，提升模型的泛化能力。论文提供了实证分析，证明了在弱监督多标签分类中正确处理损失的重要性。在PascalVOC2012、MSCOCO、NUSWIDE、CUB和OpenImages V3等数据集上，新方法的表现超越了现有的最佳方法。此外，作者还强调了相关研究的价值，如技术总结、最新技术追踪和CV领域的招聘信息，以促进计算机视觉社区的持续发展。论文链接：http://arxiv.org/pdf/2206.03740 代码链接：https://.com/snucml/LargeLossMatters 这篇工作对于理解和改进弱监督多标签分类的训练策略具有重要意义，特别是对于减少噪声标签的影响和提高模型的稳健性提供了新的见解和解决方案。

CVPR2022 | 弱监督多标签分类中的损失问题

前言本文提出了一种新的弱监督多标签分类（WSML）方法，该方法拒绝或纠正大损失样

本，以防止模型记忆有噪声的标签。由于没有繁重和复杂的组件，提出的方法在几个部分标

签设置（包括 Pascal VOC 2012、MS COCO、NUSWIDE、CUB 和 OpenImages V3 数据集）

上优于以前最先进的 WSML 方法。各种分析还表明，方法的实际效果很好，验证了在弱监

督的多标签分类中正确处理损失很重要。

欢迎关注 CV 技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、

CV 招聘信息。

论文：Large Loss Matters in Weakly Supervised Multi-Label Classification

论文：http://arxiv.org/pdf/2206.03740

代码：https://.com/snucml/LargeLossMatters

背景

弱监督多标签分类（WSML）任务是利用每幅图像的部分观察标签来学习多标签分类，由

于其巨大的标注成本，变得越来越重要。

目前，有两种简单的方法可以使用部分标签来训练模型。一种是只使用观察到的标签来训

练模型，而忽略未观察到的标签。另一种是假设所有未观察到的标签都是负面的，并将其纳

入训练，因为在多标签设置中，大多数标签都是负面的。

但第二种方法有一个局限性，即这种假设会在标签中产生一些噪声，从而妨碍模型学习，

因此之前的工作大多遵循第一种方法，并尝试使用各种技术（如引导或正则化）探索未观察

标签的线索。然而，这些方法包括大量计算或复杂的优化管道。

基于以上思路，笔者假设，如果标签噪声能够得到妥善处理，第二种方法可能是一个很好

的起点，因为它具有将许多真正的负面标签纳入模型训练的优势。因此，笔者就从噪声标签

学习的角度来看待 WSML 问题。

众所周知，当训练带有噪声标签的模型时，该模型首先适应干净的标签，然后开始记忆噪

下载后可阅读完整内容，剩余8页未读，立即下载

书博教育

粉丝: 1
资源: 2834

处理损失噪声：弱监督多标签分类的新策略

CVPR2022 - 重新审视池化：你的感受野不是最理想的.doc

无监督的MVSNet （源码）-Unsupervised MVSNet-CVPR-2019

cvpr2022汇总 分类

cvpr 2022多模态

cvpr2022语义分割

cvpr2022图卷积 动作识别

cvpr 2022图像分类

cvpr2022注意力机制

cvpr2022目标检测

CVPR2022年提出的注意力机制

最新资源

cvpr2022汇总分类

cvpr2022图卷积动作识别