RGB-D图像中行人检测的新型深度描述符

5星 · 超过95%的资源 需积分: 0 80 下载量 83 浏览量 更新于2024-09-11 1 收藏 2MB PDF 举报
"本文介绍了2012年ICPR会议上发表的一种新型深度描述子,用于RGB-D图像中的行人检测。文章作者来自浙江大学信息与电子工程系,他们提出了一种名为Pyramid Depth Self-Similarities (PDSS)的新特征描述符,该描述符基于人体深度信息具有高局部自相似性的原理。实验表明,PDSS可以有效地补充Histogram of Oriented Depth (HOD),并且结合Histogram of Oriented Gradients (HOG)、HOD和PDSS能提升行人检测的性能。" 在计算机视觉领域,行人检测是一项至关重要的任务,它广泛应用于自动驾驶、视频监控、人机交互等多个场景。随着深度相机技术的发展,实时获取高质量的彩色和深度图像变得可行,RGB-D图像因此成为行人检测的新研究热点。然而,如何从这些数据中提取有效的特征来识别行人仍然是一个挑战。 传统的二维图像特征如HOG(方向梯度直方图)在处理二维色彩图像时表现良好,但它们往往无法充分利用深度信息。为了克服这一局限,研究人员开始探索深度图像的描述子,例如HOD,它利用深度信息的方向分布来表征图像区域。然而,HOD可能不足以捕捉深度图像的所有重要细节。 在这种背景下,文章提出了PDSS特征描述符。PDSS基于深度信息的局部自相似性,即同一人体部位在不同尺度下的深度模式往往具有相似性。通过构建金字塔结构,PDSS能够在不同层次上捕捉这种自相似性,从而提供更丰富的深度信息表示。实验部分,作者使用Kinect传感器采集的RGB-D数据进行验证,结果证明PDSS能有效提高行人检测的准确性。 进一步地,为了综合利用色彩、深度和形状信息,文章将PDSS与HOG和HOD相结合。HOG特征擅长捕获物体边缘和形状信息,而HOD则关注深度变化的方向。当这三种描述子一起用于行人检测时,它们互补各自的不足,显著提升了整体检测性能。 这项工作为RGB-D图像中的行人检测提供了一个强大的特征表示框架,通过深度信息的高效利用,提高了检测的准确性和鲁棒性。这对于推动基于深度图像的计算机视觉应用,特别是行人检测技术的发展,具有重要意义。