MetaFGNet: 元学习优化与样本选择驱动的细粒度视觉分类提升

190 浏览量更新于2024-06-20 收藏 1.73MB PDF 举报

本文主要探讨了在细粒度视觉分类（FGVC）这一具有挑战性任务中的研究，特别是在面临样本不足和专业知识需求高的情况下。FGVC通常涉及到对如鸟类或犬类等特定子类别的精确识别，但每个类别可用的训练样本非常有限。这使得传统方法难以避免过拟合，特别是当依赖于从训练数据中提取全局和局部区分信息时。为了克服这种困境，研究者们提出了MetaFGNet，一个创新的深度FGVC模型，它结合了元学习优化和辅助数据样本选择策略。MetaFGNet的核心在于引入了一种新的正则化元学习目标，这个目标能够引导网络参数的学习，使其更加适应FGVC任务本身，而非仅仅依赖于通用的辅助数据集（如ImageNet）。传统的解决方案通常会使用预训练模型，先在大规模的辅助数据集上进行训练，然后针对FGVC任务进行微调。然而，MetaFGNet跳出了这个框架，通过元学习的方式，模型能够在训练过程中动态调整其结构和权重，以优化对于FGVC特定类别区分能力的掌握。文章还提出了一种简单而有效的方法，即从辅助数据中选择对FGVC任务最有帮助的样本，以增强模型的性能。这种方法认为，不是所有的辅助数据都同等重要，选择那些与FGVC任务相关的样本可以提升模型的针对性和泛化能力。实验证明，MetaFGNet以及所提出的样本选择策略在基准FGVC数据集上的实验结果表现出显著的优势，显示出其在细粒度视觉分类任务中具备出色的性能。关键词包括细粒度视觉分类、元学习、样本选择等，这些都是研究的核心要素。这篇文章提供了一个新颖的思路，即如何利用元学习优化和辅助数据的选择来改善细粒度视觉分类模型的性能，特别是在样本稀缺的情况下，这为未来在该领域的研究开辟了新的可能性。

张亚斌，唐辉，贾奎

[6]提出了一种分层的三级区域注意机制，该机制能够注意到具有区分

性的区域，其中区域区分度由分类概率来度量。通过对[37]中卷积特

征图的空间相关通道进行聚类和加权来生成多部分注意力图。

存在处理整个图像而不是局部部分的FGVC方法[20，2，18，4，

14，28]，但是它们的另一种方法通过识别和利用ImageNet之外的辅助

数据来推动最先进的技术。特别地，[11]的方法简单地通过使用通过

使用鸟的从属类别作为搜索关键词获得的巨大辅助网络图像集来预训

练标准深度模型，从而在CUB-200-2011上设置了惊人的基线;注意，这

样获得的辅助图像在它们的类别标签方面是相当嘈杂的。Xie

等人。

[30]提出用大量由超类标记的辅助图像来增强细粒度数据;这些超类是

一些比细粒度类别标签更容易标注的属性，因此可以容易地获得大量

带有属性标签的图像;通过联合训练超类分类模型和FGVC，FGVC的性

能得到了改善。Ge和Yu [7]不是从互联网上搜索语义上更相关的辅助

数据，而是提出通过将ImageNet图像与目标FGVC任务的训练集中的

图像进行比较，使用低级特征（例如，Gabor滤波器响应）;然后，使

用这种改进的ImageNet来联合训练具有FGVC任务的训练图像的模

型。

所有上述方法都使用辅助数据来预训练模型，或者与目标FGVC任

务的训练图像联合训练模型。相比之下，我们提出的MetaFGNet使用

了一个正则化的元学习目标，可以充分利用辅助数据，同时使获得的

模型最优，以进一步适应目标FGVC任务。在第三节中，我们还从技

术上和第五节中从经验上对我们的训练目标与联合训练的目标进行了

比较。

Meta学习的目的是从历史中学习经验，并借助历史知识适应新的

任务小样本学习是其应用之一[10]训练一个siamese神经网络用于验

证的任务，即识别输入对是否属于同一类;一旦训练了验证模型，

就可以通过计算测试图像和标记图像之间的相似性来将其用于少

量或一次性学习。[25]利用一个扩充了外部存储器的神经网络实现

少样本学习;使用两次嵌入将图像映射到特征空间，通过测量特征空

间中的余弦距离来获得分类;通过LSTM注意力模块，测试图像的嵌入

可以通过整个支持集进行修改，这使得模型更合理地利用支持集，

并且有效地在[19]中，SGD被元LSTM取代，它可以学习训练网络

的更新规则。Finn

等人

[5]提出了一种称为MAML 的Meta学习方

法，它以多任务的方式训练元模型。与MAML的问题设置不同

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

MetaFGNet: 元学习优化与样本选择驱动的细粒度视觉分类提升

小样本细粒度图像分类的混合注意机制

超细粒度少样本类增量学习的SSFE-Net模型对超细粒度视觉分类问题提出了一种自监督特征增强的少镜头增量学习...

细粒度视觉分类的注意力卷积二元神经树方法及其在数据集上的实验

细粒度视觉分类和再识别的反事实注意力学习

适合细粒度图像分类的方法，以及能提升细粒度图像分类精度的具体方法，以及如何进行数据处理

怎样同时获得cifar100数据集的细粒度标签和粗粒度标签

基于小样本数据生成的虚拟样本，如何评价虚拟样本的有效性

技术文档-基于深度学习的细粒度人体姿态与步态软件研发pdt

对于小样本特征提取的分类模型有哪些

如何对分类模型进行优化

最新资源