
传感器与微系统
( Transducer and Microsystem Technologies) 2018
年
第
37
卷 第
4
期
DOI: 10.13873/J.1000
—
9787( 2018) 04
—
0136
—
03
基
于双目视觉的三维重构算法实现
王媛
媛
,
刘学成
,
伍凤娟
(
西安科技大学
电气与控制工程学院
,
陕西 西安
710054)
摘 要
:
基于
Altera DE1 SOC
开发平台
,
选用
OV7725
互补金属氧化物半导体
( CMOS)
摄像头组进行图像
采集
,
经现场可编程门阵列
( FPGA)
预处理后由视频图形阵列
( VGA)
显示器显示
。
基于双目视觉的三维
场景重构算法包含图像预处理
、
多线程加速 立体匹配以及
AD-Census
匹配
,
采用了
Verilog HDL
和统一计
算设备架构
( CUDA)
编程实现
。
实验结果表明
:
系统实现了以
7
帧
/s
速度计算
640
像素
×
480
像素大小的
深度图
;
并且可以将以
1.8°
为间隔的
150
幅深度图转换为点云
,
重构出
270°
左右视野内的三维场景
。
关键词
:
双目视觉
; AD-Census
算法
;
重构
;
三维场景
中图分类号
: TP 391.9
文献标识码
: A
文章编号
: 1000
—
9787( 2018) 04
—
0136
—
03
Implementation of 3D reconstruction algorithm
based on binocular vision
WANG Yuan-yuan,LIU Xue-cheng,WU Feng-juan
( College of Electrical and Control Engineering,Xi’an University of Science and Technology,Xi’an 710054,China )
Abstract: A system based on Altera DE1 SOC,which uses the OV7725 complementary metal oxide
semiconductors( CMOS) camera group to collect images,and images are displayed by video graphics array( VGA)
after field programmable gate array( FPGA) preprocessing . The reconstruction algorithm of binocular vision 3D
scene includes image preprocessing,multi-thread acceleration stereo matching and AD-Census matching. The
algorithm is programmed with Verilog HDL and compute unified device architecture( CUDA) .Experimental results
show that the system calculating a depth map with 640
×
480 size is achieved at speed of 7 frames per second,and
150 depth maps at 1. 8° intervals can be converted into point clouds,3D scenes in about 270° of view is
reconstructed.
Keywords: binocular vision; AD-Census algorithm; reconstruction; 3D scene
0
引 言
目
前
,
国内外主要的三维
( 3D)
图像数据采集技术有空
间结构光编码技术
、
飞行时间
( time of flight,TOF)
法和双目
视觉法
3
种
。
其中
,
双目视觉具有适应室内和室外
,
不怕阳
光干扰
,
适应远距离采集景深数据等优点
,
但因计算量大
,
限制了其在低计算能力
、
低功耗和高实时性场合的应用
。
近年来
,
国内外已提出了一些优化的双目视觉实现方法
,
大
多基 于 高 性 能 数 字 信 号 处 理 器
( digital signal processor,
DSP) 、
多核中央处理单元
( central processing unit,CPU)
并
行或者直接进行显卡编程用统一计算设备架构
( compute
unified device architecture,CUDA)
进行加速
。
随着电子技术
的发展
,
现场可编程门阵列
( field programmable gate array,
FPGA)
在数字信号处理领域应用愈加广泛
,
其设计的灵活
性和可并行执 行性
,
使得经过并行优化的算法应用于
FPGA
中能够成倍提升执行效率
[1,2]
。
本
文主要针对双目视觉中的摄像机标定方法
、
立体匹
配算法以及三维重构算法进行研究
,
并利用
FPGA
作为计
算平台
,
实现了场景深度信息的获取
,
具有很好的三维显示
效果
。
1
双目视觉与三维重构算法原理
双目视觉技术模拟人眼视觉系统
,
依据计算机视觉相
关的理论和技术
,
利用双目摄像头采集同一场景不同位置
的左右路图 像
,
对场景进行三维重建
[3,4]
。1)
由
于摄像头
存在加工误差
,
使得原始图像存在微小畸变
,
因此
,
需要对
图像采用畸变校正和极线校正补偿硬件误差预处理
,
以及
标定摄像机
。
标定 方 法 采 用双目图像预处理算 法 实 现
。
2)
当要对两相机图像重叠部分的每个像素点均给出一个
视差和距离时
,
难以确定两相机图像上实际场景中的某个
收
稿日期
: 2018
—
01
—
16
631
评论0