硬样本重加权三重损失提升地空影像定位性能

0 下载量 14 浏览量 更新于2024-06-20 收藏 1.5MB PDF 举报
本文主要探讨了地空影像定位中的关键问题和创新方法。传统的地对地图像匹配依赖于地面视图图像,这在覆盖大区域时存在局限性。随着航空/卫星图像的广泛应用,地空影像匹配逐渐成为一种重要的粗级地理定位和地点识别手段,但因巨大的视角变化、照明差异以及方向不确定性等问题,这一任务极具挑战性。 作者提出的基于硬样本重加权三重损失的方法,旨在提高地空图像匹配的性能。该方法的核心是引入了一个新型的批量重加权策略,通过逻辑回归和距离校正因子,评估每个三元组(查询图像、参考图像和锚点)的难度。这个评估过程允许模型在端到端训练中更有效地关注那些困难的样本(硬样本),同时减轻极端硬数据和简单样本的影响。 为了进一步增强模型性能,作者还融入了注意力机制,利用功能级的上下文信息来指导模型对图像特征的学习。通过比较三元组的相对难度,生成的权重被上界和下界约束修剪,以实现更均衡的样本处理。这种方法在两个基准数据集上的实验结果表明,它显著优于现有的地空图像定位技术,证明了其在解决视图变化和方向不确定性问题方面的有效性。 本文贡献了一个新颖的深度学习框架,结合了三重损失、注意力机制和样本权重调整,为地空影像定位领域的研究提供了一种有效且高效的解决方案。这对于推动自动驾驶、增强现实和移动机器人等领域的发展具有重要意义。