学习仿射区域与图像检索中的应用:超越几何重复性

0 下载量 170 浏览量 更新于2024-06-20 收藏 1.02MB PDF 举报
"本文主要探讨了学习仿射区域在图像检索中的重要性和应用,强调了单纯提高几何重复性并不能确保局部特征的可靠匹配,提出了基于描述符学习的必要性。作者们提出了一种新的学习方法,即使用硬负常数损失函数来训练仿射形状估计器AffNet,该方法在图像检索和宽基线立体匹配任务中表现出优越性能。文章还讨论了影响学习和注册的因素,如损失函数、描述符类型、几何参数化以及匹配性和几何精度的平衡。提供的关键词包括局部特征、仿射形状、损失函数和图像检索。" 在图像处理和计算机视觉领域,局部特征起着至关重要的作用,特别是在3D重建、双视图匹配和图像定位等任务中。传统的局部特征,如ORB和DoG,虽然具有尺度协变性,但对仿射变换的鲁棒性不足。相反,仿射协变特征如Hessian-Affine检测器结合RootSIFT描述符,因其能够处理宽基线图像的匹配问题,成为图像检索的标准方法。 然而,经典的仿射自适应过程存在一定的局限性,成功率通常在60%-80%之间,并且在显著的光照变化下性能下降,导致局部特征数量减少和可重复性的降低。这直接影响到依赖大量对应关系的应用,如大规模3D重建和图像检索。因此,提高仿射区域的可靠性和鲁棒性至关重要。 作者们提出了一种新的学习仿射区域的方法,通过最大化几何重复性并结合描述符学习,解决了单纯提高几何重复性不足以确保可靠匹配的问题。他们设计了一种硬负常数损失函数,用于训练AffNet,这是一种用于估计仿射形状的神经网络。经过这种损失函数训练的AffNet在图像检索和宽基线立体匹配的性能上超越了现有的最佳方法,并且在训练过程中不需要精确的几何对齐数据。 总结来说,这篇文章强调了学习仿射区域的重要性,尤其是对于提高局部特征的匹配质量和鲁棒性,以及在实际应用中提升系统性能的影响。提出的AffNet模型和训练策略为未来的研究提供了新的方向,旨在进一步优化局部特征的提取和匹配,以应对更复杂、更具挑战性的视觉识别任务。