双目图像自相关多任务立体匹配算法

3 下载量 14 浏览量 更新于2024-08-29 收藏 8.11MB PDF 举报
"基于多任务学习的立体匹配算法通过利用双目图像的自相关性,在无需额外标签数据的情况下,提出了一种多任务学习方法。该算法在多层级渐进细化过程中整合了边缘和特征一致性信息,并通过循环迭代优化视差图。通过构建考虑局部平滑性和左右特征一致性的损失函数,模型能在无监督学习环境中学习到关键信息。同时,通过尺度注意的空间金字塔池化,模型能适应性地识别不同区域和尺度的特征。实验结果显示,这种方法提高了视差图的精度,对于视差图的可信区域判断有显著帮助,并在无监督学习中确定单视角可见区域。在KITTI2015测试集上,该算法的性能和效率表现出色。" 立体匹配是机器视觉领域的一个重要课题,涉及到深度信息的获取,对于自动驾驶、机器人导航等应用至关重要。深度学习技术的引入极大地提升了立体匹配的准确性,但同时也增加了模型训练的复杂度。多任务学习是一种有效的方法,它允许模型同时学习多个相关的任务,从而增强模型的理解能力。然而,这通常需要大量的额外标签数据。 本文提出的算法解决了这一问题,通过双目图像的自相关性进行多任务学习,无需额外的标签数据。在多层级的匹配过程中,算法结合了边缘信息(如图像的边界)和特征一致性(图像左右两部分对应点的相似性),这两个辅助任务有助于模型捕捉图像的关键结构。边缘信息有助于识别物体的边界,特征一致性则帮助确认对应点的关系,这对于精确计算视差图至关重要。 在损失函数的设计上,算法考虑了双目图像中视差的局部平滑性和左右特征一致性,这种设计使得模型可以在无监督的环境下学习到这些关键特性。此外,提出的尺度注意的空间金字塔池化机制,允许模型根据局部图像特征动态调整不同区域和尺度特征的重要性,增强了模型的适应性和鲁棒性。 实验结果验证了这种方法的有效性。辅助任务的引入不仅提高了视差图的精度,还为评估视差图的可信度提供了依据。在无监督学习场景下,这种方法能够帮助确定单视角下的可见区域,进一步拓展了其应用场景。在标准的KITTI2015测试集上,提出的算法在精度和运行效率上都有良好的表现,证明了其在实际应用中的竞争力。 这项工作在立体匹配领域提出了一个创新的多任务学习框架,它通过自我监督和有效的特征学习策略,提高了无监督学习环境下的立体匹配性能,为未来的研究提供了新的思路。