多维特征融合在双目立体匹配算法中的应用

8 下载量 65 浏览量 更新于2024-08-28 收藏 11.5MB PDF 举报
"基于多维特征融合的双目立体匹配算法研究" 本文主要探讨了一种针对双目立体匹配问题的新算法,该算法旨在提高在不适定区域(如弱纹理区域、反光表面、细长结构、视差不连续区域)的匹配精度。传统的基于卷积神经网络(CNN)的双目立体匹配方法常常只关注像素级别的特征,而忽略了全局特征信息的融合,这导致在处理复杂场景时匹配精度下降。为了解决这一问题,作者提出了基于多维特征融合(MDFF)的立体匹配算法。 该算法的核心由三个关键模块构成:残差开端(Inception-ResNet)模块、空间金字塔池化(SPP)模块和堆叠沙漏网络(SHN)模块。Inception-ResNet模块采用的是Inception网络架构的改进版,结合了不同大小的卷积核,能有效提取图像对的局部特征,这些特征对于识别局部结构和细节至关重要。空间金字塔池化(SPP)模块则引入了全局特征的提取,通过多层次的池化操作,可以捕捉到图像的全局上下文信息,这对于处理全局匹配问题非常有帮助。最后,堆叠沙漏网络(SHN)模块负责对匹配代价卷进行规范化,它采用沙漏型结构,通过上采样和下采样的结合,能够恢复图像的原始分辨率并优化匹配过程。 实验结果显示,该算法在权威的KITTI2012和KITTI2015数据集上的三像素平均误匹配率分别达到1.62%和1.78%,这一成绩优于多数国内外先进算法。同时,该方法在Apollo数据集和Middlebury数据集上也有着良好的表现,证明了其在不同场景下的适应性和鲁棒性。 双目立体匹配是机器视觉中的关键技术,广泛应用于自动驾驶、机器人导航、三维重建等领域。通过多维特征融合,该算法提高了在具有挑战性环境条件下的匹配效果,有助于提升整体系统在复杂环境中的定位和避障能力。因此,这种算法不仅对于学术研究具有重要意义,也为实际应用提供了有力的技术支持。