ReLabel：改善ImageNet，自动转换为多标签数据集

版权申诉

193 浏览量更新于2024-08-07 收藏 2.1MB DOC 举报

"ReLabel是一种新的方法，旨在将ImageNet这样的单标签数据集转换为多标签数据集，以提高有监督训练的准确性。该方法通过自动标注网络获取像素级的多标签信息，减少了人工标注的成本。同时，ReLabel还提出了LabelPooling策略，与随机裁剪（Random Crop）结合使用，以解决数据增强过程中可能引发的噪声问题。论文及其代码已经公开，为研究者提供了进一步了解和应用ReLabel的途径。" 在计算机视觉领域，ImageNet数据集是一个非常关键的资源，用于训练和评估图像识别模型。然而，ImageNet假设每张图片只包含一个目标，这在现实世界中并不总是准确的。ReLabel这篇论文指出，这种假设导致了数据集中的噪声，而这些噪声可能误导模型的训练。作者发现，随机裁剪数据增强策略可能会加剧这个问题，因为它忽略了图片中可能存在的多个目标。 ReLabel的方法是使用一个标注网络，即machine annotator，它可以在像素级别提供多标签信息。这个网络可以从任意的SOTA（State-of-the-Art）网络结构中选择，考虑到训练时间，通常使用在Super-ImageNet上预训练的模型，在ImageNet上进行微调。由于数据集中的噪声，即使网络最初是在单标签数据集上训练的，它也具有潜在的多标签预测能力。为了适应多标签任务，原网络的全局池化层被移除，取而代之的是\(1\times 1\)卷积层，以生成像素级别的标签。这样修改后的网络可以提供更加细致的标注信息。 ReLabel的主要优势在于其高效性。不同于传统的知识蒸馏方法，每张图片需要多次前向计算，ReLabel只需要对每张图片进行一次前向计算，后续的处理主要是简单的比例计算，大大降低了计算复杂度。这使得大规模数据集的处理变得更为可行，降低了对计算资源的需求。 ReLabel是一个创新的解决方案，它不仅解决了单标签数据集的局限性，还改进了数据增强技术，提升了模型训练的准确性。通过将ImageNet转化为多标签数据集，这种方法有助于构建更强大的深度学习模型，适应复杂的真实世界场景。对于研究人员和开发者来说，ReLabel提供的论文和代码资源为他们在相关领域的研究提供了宝贵的工具和方向。

ReLabel：自动将 ImageNet 转化成多标签数据集，更准确地有监督训练 | 2021 新文

人工标注数据集中普遍存在噪声，ReLabel 能够自动且低成本地将原本的单标签数据集转

化为多标签数据集，并且提出配合 random crop 使用的高效 LabelPooling 方法，能够更准确

地指导分类网络的训练

来源：晓飞的算法工程笔记

论文: Re-labeling ImageNet:from Single to Multi-Labels, from Global to Localized Labels

论文地址：https://arxiv.org/abs/2101.05022

论文代码：https://.com/naver-ai/relabel_imagenet

Introduction

下载后可阅读完整内容，剩余7页未读，立即下载

书博教育

粉丝: 1

ReLabel：改善ImageNet，自动转换为多标签数据集

relabel::label:交互式批量重命名工具

relabel_imagenet

算法导论--Introduction.to.Algorithms

算法设计与分析：6-Lec10.pdf

图论- 网络流.rar

Network Flows - Theory, Algorithms, And Applications）-part two.rar

Push-Relabel Maximum Matching

Way-to-Algorithm-算法之路.pdf

Noise-label-generation-and-relabeling:在给定噪声率的情况下为数据集生成噪声标签，并使用重新标记算法对这些噪声标签进行重新标记

04relabel_configs配置介绍及使用.md

最新资源