实时RGB-D图像拼接:多Kinect扩展视野

0 下载量 48 浏览量 更新于2024-08-27 2 收藏 864KB PDF 举报
"这篇研究论文探讨了如何使用多个Kinect传感器进行实时RGB-D图像拼接,以扩大视野并解决Kinect式RGB-D传感器的深度图缺陷和有限视场问题。文章提出了一种基于各向异性扩散的空洞填充方法来修复深度图中的无效深度数据,并通过颜色图像对齐,利用颜色图像配准计算的数据,实现实时地将深度和颜色图像拼接成深度和颜色全景图像。实验表明,所提出的拼接方法能在实时情况下生成无无效深度数据、低失真的RGB-D全景图像,并可扩展到包含更多RGB-D传感器以构建360度全景RGB-D图像。关键词包括深度图像拼接、RGB-D全景、增强视场、深度图空洞填充、Kinect以及图像配准。提交日期:10月12日。" 本文的研究重点在于解决Kinect类RGB-D传感器的局限性,即深度图的质量问题(如存在无效深度数据)和有限的视场。作者提出了一种新的解决方案,即使用多个Kinect设备进行实时图像拼接,从而实现视场的扩展。 首先,针对深度图中的无效深度数据问题,论文引入了一种基于各向异性扩散的空洞填充方法。这种方法旨在恢复深度图中丢失或错误的数据,提高深度信息的完整性和准确性。各向异性扩散是一种平滑图像的方法,它能根据像素邻域内的结构信息进行局部平滑,避免过度平滑导致的细节损失。 其次,为了扩展RGB-D传感器的视场,论文提出了一个图像拼接框架。该框架通过颜色图像的配准来对齐多个Kinect的深度和颜色图像。利用颜色图像配准过程产生的数据,可以准确地将来自不同传感器的图像融合在一起,从而构建出一个连续且无明显拼接痕迹的深度和颜色全景图像。 实验结果证明,这种实时的RGB-D图像拼接方法能够有效消除无效深度数据,并保持较低的图像失真,这在实时应用中尤其重要。此外,该方法具有良好的扩展性,可以适应更多的RGB-D传感器,进而创建出具有更广阔视场,甚至是360度全景的RGB-D图像。 这篇研究论文为提高基于Kinect的RGB-D系统的性能提供了创新思路,对于机器人导航、环境感知和虚拟现实等领域有着重要的实际应用价值。关键词涵盖的深度图像处理技术、全景图像生成和多传感器融合等都是当前计算机视觉和机器人学领域的热点问题。