深度学习优化：基于7层卷积神经网络的稠密视差图提取

2 浏览量更新于2024-08-27 收藏 7.33MB PDF 举报

"该文提出了一种基于改进卷积神经网络的稠密视差图提取方法，旨在解决传统方法在生成视差图时细节损失严重的问题。通过增加网络的卷积层深度至7层，提高了特征提取的精度，并且利用双金字塔结构融合多尺度信息，以保留图像的原始细节。实验结果显示，新方法能有效降低错误率，提高视差图的连通性。" 本文详细探讨了在图像处理领域中，如何通过深度学习特别是卷积神经网络（CNN）来优化立体匹配过程中的视差图提取。视差图是立体视觉中用于计算两个视角之间像素对应关系的关键，其质量直接影响到3D重建和场景理解的准确性。传统的卷积神经网络方法在生成视差图时，常常因为信息丢失导致细节模糊，这对许多应用如自动驾驶、机器人导航等造成了困扰。作者黄东振等人提出的改进策略主要包含两部分。首先，他们增加了网络的特征提取层，将原来的4层卷积结构扩展到7层。这样的改动使得网络能够捕获更复杂的特征，从而提高估计视差的精确度，减少了错误率。其次，他们引入了双金字塔结构，这种结构允许网络同时处理不同尺度的信息，既能保证全局的视差估计，又能维护局部的细节信息，防止因降采样造成的细节损失。实验部分，作者对比了改进前后的效果，发现新方法的错误率从3.029%降低到2.795%，这表明了改进方案的有效性。此外，生成的视差图显示出更好的连通性，这意味着像素间的匹配更为准确，对于后续的3D重建等任务来说，具有更高的可靠性。这项工作为深度学习在图像处理中的应用提供了新的思路，特别是在稠密视差图的生成上。通过结构优化，可以有效地平衡精度与细节保留，为未来的研究和实际应用提供了有价值的参考。关键词包括图像处理、视差获取、深度学习、卷积神经网络和立体匹配，这些关键词涵盖了研究的核心内容和技术手段。该研究的成果不仅对学术界有重要意义，也对依赖高精度视差图的工业应用有着深远的影响。

激光与光电子学进展





(



)

















中国激光

杂志社

基于改进卷积神经网络的稠密视差图提取方法

黄东振





赵沁





刘华巍



李宝清



袁晓兵

󰁓



中国科学院上海微系统与信息技术研究所微系统技术重点实验室

上海



;



中国科学院大学

北京



摘要



针对现有的卷积神经网络方法所生成的视差图中细节损失严重的问题

提出了在结构上改进的新方法

将

原有网络中特征提取部分的



层卷积结构提升到



层

最大化提高了精度

;

在网络中引入了双金字塔结构

将多尺

度降采样信息和特征信息进行了融合

保持了输入图像中的原始细节信息

实验结果表明

改进后网络的错误率

从



降到了



生成的视差图具有更好的连通性

关键词



图像处理

;

视差获取

;

深度学习

;

卷积神经网络

;

立体匹配

中图分类号



文献标识码

 doi





DenseDis

arit

Extraction MethodBasedonIm

roved

ConvolutionalNeuralNetwork



































󰁓



Laborator

Micros

stem Technolo



Shan

haiInstituteo

Micros

stem andIn

ormationTechnolo



ChineseAcadem

Sciences



Shan

hai



China





Universit

ChineseAcadem

Sciences



Bei



China

Abstract 







 









 

 





 











































 



 󰁒 󰁒

































 





















words



































OCIScodes



收稿日期

󰁒󰁒

;

修回日期

󰁒󰁒

;

录用日期

󰁒󰁒

基金项目

微系统技术国防科技重点实验室基金

(

󰁒

)



󰁓

EＧmail





引



言

近年来

随着立体视觉算法的迅速发展

基于立

体视觉算法进行三维重构的各种应用已经走进人们

的视线

比如无人机勘测

、

无人驾驶汽车等

王琪龙

等

[



]

提出结合双目视觉与激光测距的目标跟踪系

统

解决了时滞问题

提高了算法的实时性

大多数

双目立体视觉算法均是围绕视差展开

视差是指物

体在左右视图中像素坐标水平方向的差值

根据简

单的三角测量原理

可以由物体的视差结合像素焦

距

、

基线距离得到其深度

进而通过三角形相似获取

该物体完整的三维空间位置信息

提取稠密准确的

视差图是三维重构的关键

视差获取则需要物体在

左右视图中的对应关系

通过物体匹配获取视差的方法最早由



等

[



]

进行总结归纳

基本分为



个步骤

匹配代价计算

、

代价聚合

、

视差计算以及视差细化







等

[



]

将视差获取问题转换成全局能量最小

化问题

通过建立网络图

基于图论方法求解从而得

到视差图



[



]

基于匹配像素之间的互

󰁒

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38575536

粉丝: 3

深度学习优化：基于7层卷积神经网络的稠密视差图提取

基于卷积神经网络的视差图生成技术.pdf

基于图像的几何建模技术综述

行业文档-设计装置-无人机平台基于单目SLAM的多关键帧协同地面目标定位方法.zip

立体视觉深度估计：稠密匹配技术解析

三维空间重建：ORB-SLAM3稠密点云技术深度探索与实践

立体视觉SLAM技术：ORB-SLAM3稠密点云映射原理与应用案例分析

基于深度学习的双目视觉三维重建

vue.js v2.5.17

DM8-SQL语言详解及其数据管理和查询操作指南

1108_ba_open_report.pdf

最新资源