端到端神经网络：成对混淆解决细粒度视觉分类的类间相似性

31 浏览量更新于2024-06-20 收藏 912KB PDF 举报

成对混淆（Pairwise Confusion, PC）是一种新颖的端到端神经网络训练策略，专为解决细粒度视觉分类（Fine-grained Visual Classification, FGVC）中的类间相似性问题而设计。FGVC任务通常涉及识别具有高度相似外观的类别，例如特定品种的鸟类或花卉，这要求模型具备精细的区分能力。与大规模视觉分类（Large Scale Visual Classification, LSVC）相比，FGVC数据集的特点包括样本数量较少、类内变化明显（如姿势、光照和视角）、以及类间视觉差异较小，这构成了对深度学习算法的挑战。传统的FGVC研究策略着重于解决类内变化，例如利用定位和分割技术来增强特征表示。然而，类间相似性问题并未得到有效解决，它可能会影响特征学习和分类性能。成对混淆方法的独特之处在于，它通过在训练过程中引入故意的混乱，即“成对混淆”正则化，来对抗这一问题。这种方法通过减少模型过度拟合，促使模型学习到更通用的特征，从而提高在多个广泛使用的FGVC数据集上的表现。实施成对混淆并不复杂，无需大量超参数调整，且在测试阶段对计算资源的需求相对较低。这种方法的优势在于其易于集成到现有的神经网络架构中，能够在保持高效的同时显著提升分类精度。通过在六大数据集上的实验，PC展示了其在提升定位准确性和整体性能方面的优越性，证实了其在细粒度视觉分类任务中的有效性。成对混淆提供了一种创新的解决方案，它针对FGVC中的核心挑战，即如何处理类间相似性，从而推动了该领域的发展，有望在未来的研究中成为细粒度视觉分类的标准实践。

A.杜贝岛Gupta，P. Guo，R.拉斯卡尔河Farrell和N. Naik

θ i 2

使用大量参数训练深度神经架构-即使初步层被冻结。此外，训练数

据可能不完全代表真实世界的数据，存在某些类别的更丰富采样等问

题。例如，在鸟类的FGVC中，来自地理上可访问区域的某些物种因

此，神经网络可以学习锁定图像中的样本特定我们的目标是解决

FGVC中的这两个问题（过拟合和样本特定的伪影），方法是将不同

的类条件概率分布更接近并

混淆

深度网络，随后降低其预测过度置信

度，从而提高泛化性能。

让我们形式化的想法“混淆”的条件概率分布。考虑两个输入图像

和

的条件概率分布，其中可以由

（

y）给出

）

和

（

）

保

留

。

对于

具有N个输出类的分类问题，这些分布中的每一个都是N维

向量，其中每个元素

表示给定输入x的分类器在类

中的置信度。如果

我们希望

混淆

分类器对

和

的类输出，我们应该学习参数

，该参数

使这些条件概率

分布

“ 闭合 ” 并且使这些条件概率分布变

得简单，这使得 x 1 和 x 2 的预测相似

。

虽然KL发散似乎是设计损失函数以优化条件概率分布之间距离的

合理选择，但在第3.1节中，我们证明了使用KL发散作为正则化器来

训练神经网络是不可行的。因此，我们在第3.2节和第3.3节中引入了

分布之间的欧氏距离作为混淆的度量，并在第3.4节中描述了使用该度

量的神经网络训练。

3.1 S

测量一个概率分布与另一个概率分布的不相似性的最普遍的方法是使用

Kullback-Liebler（KL）散度。然而，标准的KL散度不能服务于我们的目

的，由于其不对称的性质。这可以通过使用

对称

KL散度来补救，该对称

KL散度定义用于两

个

概率

分布

、

，其中具有

多个函数

（

）

、

（

）

（

对于

每个

∈

）

：

（

，

），

∈U

（

）

（

）

（

）

（

）

（u）

（

）

（

）+

（

）

（1）

分布的系统化分布，称为

分布[40]，是两个概率分布之间的平均相对

熵的度量[ 41 ]。

对于由

表示的我们的

模型参数

，对于样本

和

，

的

导数

（

）

，

（

））

（

）

（

）

−

（

））

log

（

）

（二）

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

端到端神经网络：成对混淆解决细粒度视觉分类的类间相似性

基于知识蒸馏与目标区域选取的细粒度图像分类方法_赵婷婷.pdf

fgvc:细粒度视觉分类

Vision Transformer 网络对200种细粒度鸟类图片数据集的分类，包含训练权重和数据集

plotConfMat:绘制混淆矩阵（分类）

matlab神经网络和优化算法：7概率神经网络分类问题程序.zip

基于BP神经网络的多分类预测，基于BP神经网络的多分类识别，基于混淆矩阵的分析的BP神经网络分类识别（代码完整，数据齐全）

入门MATLAB神经网络和优化算法专题：7 概率神经网络分类问题程序.zip

双线性聚合残差注意力的细粒度图像分类模型.docx

通过径向基函数神经网络分类：使用径向基函数神经网络对 2 类和 3 类问题进行一维矩阵分类的基本教程-matlab开发

BPNN分类教程--神经网络：使用反向传播神经网络对2类和3类问题进行一维矩阵分类的基础教程-matlab开发

最新资源