自适应三重态损失在图像分类和图像检索中的应用研究

0 下载量 68 浏览量 更新于2024-06-20 收藏 3.1MB PDF 举报
深度度量学习中的三重态损失及其适应性方法研究 深度度量学习旨在学习相似性或距离度量,其具有小的类内变化和大的类间变化。三重损失是深度度量学习的一种流行损失函数,在许多计算机视觉任务中取得了巨大成功,例如细粒度图像分类、图像检索、人员重新识别和人脸识别。 在深度度量学习中,三重损失是度量学习中的一种常用方法。然而,三联体选择对于在三联体丢失的情况下有效训练是必不可少的。在实践中,训练通常对三元组的选择非常敏感,例如,它几乎不收敛于随机选择的三元组,并且选择最难的三元组也导致不良的局部最小值。 为了解决这个问题,我们提出了一个新的变体的三重损失,它试图通过自适应地校正所选择的三重峰的分布偏移,以减少在三重峰选择的偏见。我们将这种新的三重态损失称为适应的三重态损失。 在本文中,我们在MNIST和Fashion-MNIST上进行了大量的图像分类实验,并在CARS196、CUB200-2011和Stanford OnlineProducts上进行了图像检索实验。实验结果验证了该方法的有效性。 本研究的贡献在于: 1. 我们提出了一个新的变体的三重损失,它试图通过自适应地校正所选择的三重峰的分布偏移,以减少在三重峰选择的偏见。 2. 我们在MNIST和Fashion-MNIST上进行了大量的图像分类实验,并在CARS196、CUB200-2011和Stanford OnlineProducts上进行了图像检索实验。 3. 实验结果验证了该方法的有效性。 在深度度量学习中,三重损失是一种常用的损失函数,但是它存在一些缺陷,例如三联体选择的敏感性和局部最小值的问题。为了解决这个问题,我们提出了一个新的变体的三重损失,它试图通过自适应地校正所选择的三重峰的分布偏移,以减少在三重峰选择的偏见。 在图像分类和图像检索任务中,三重损失的适应性方法可以提高模型的性能。实验结果验证了该方法的有效性,证明了该方法在图像分类和图像检索任务中的应用价值。 本研究的贡献在于提出了一种新的三重态损失的变体,并验证了该方法在图像分类和图像检索任务中的有效性,为深度度量学习领域的发展做出了贡献。