RGB-D图像中行人检测的新型深度描述符
5星 · 超过95%的资源 需积分: 0 83 浏览量
更新于2024-09-11
1
收藏 2MB PDF 举报
"本文介绍了2012年ICPR会议上发表的一种新型深度描述子,用于RGB-D图像中的行人检测。文章作者来自浙江大学信息与电子工程系,他们提出了一种名为Pyramid Depth Self-Similarities (PDSS)的新特征描述符,该描述符基于人体深度信息具有高局部自相似性的原理。实验表明,PDSS可以有效地补充Histogram of Oriented Depth (HOD),并且结合Histogram of Oriented Gradients (HOG)、HOD和PDSS能提升行人检测的性能。"
在计算机视觉领域,行人检测是一项至关重要的任务,它广泛应用于自动驾驶、视频监控、人机交互等多个场景。随着深度相机技术的发展,实时获取高质量的彩色和深度图像变得可行,RGB-D图像因此成为行人检测的新研究热点。然而,如何从这些数据中提取有效的特征来识别行人仍然是一个挑战。
传统的二维图像特征如HOG(方向梯度直方图)在处理二维色彩图像时表现良好,但它们往往无法充分利用深度信息。为了克服这一局限,研究人员开始探索深度图像的描述子,例如HOD,它利用深度信息的方向分布来表征图像区域。然而,HOD可能不足以捕捉深度图像的所有重要细节。
在这种背景下,文章提出了PDSS特征描述符。PDSS基于深度信息的局部自相似性,即同一人体部位在不同尺度下的深度模式往往具有相似性。通过构建金字塔结构,PDSS能够在不同层次上捕捉这种自相似性,从而提供更丰富的深度信息表示。实验部分,作者使用Kinect传感器采集的RGB-D数据进行验证,结果证明PDSS能有效提高行人检测的准确性。
进一步地,为了综合利用色彩、深度和形状信息,文章将PDSS与HOG和HOD相结合。HOG特征擅长捕获物体边缘和形状信息,而HOD则关注深度变化的方向。当这三种描述子一起用于行人检测时,它们互补各自的不足,显著提升了整体检测性能。
这项工作为RGB-D图像中的行人检测提供了一个强大的特征表示框架,通过深度信息的高效利用,提高了检测的准确性和鲁棒性。这对于推动基于深度图像的计算机视觉应用,特别是行人检测技术的发展,具有重要意义。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2023-08-07 上传
2021-05-28 上传
2023-04-08 上传
2021-05-18 上传
2021-05-14 上传
2021-05-22 上传
masikkk
- 粉丝: 1626
- 资源: 105
最新资源
- 易语言易速启动V1.2源码
- Excel-VBA实用技巧范例-预览和打印.zip
- GFCC和MFCC特征提取(python代码)
- 电机转速表设计-综合文档
- VB软件管理程序
- ant-design-vue-3.2.5.zip
- 通风与空调工程施工组织设计-钢铁设计院某住宅楼通风工程施工组织设计
- ougn-java-oracle-db:使用不同技术从 Java 与 Oracle 数据库通信的示例项目
- 系统服务开发,解决交互桌面权限问题,穿透Session 0 隔离
- 基于Python实现对链家二手房数据进行采集并用CSV进行保存源代码
- opencv4.2.0+opencv_contrib+CUDA10.1利用cmake编译中容易下载失败的文件
- MATLAB数据字典生成代码-dsc-introducing-python-libraries-nyc-ds-033020:dsc简介pyth
- Excel-VBA实用技巧范例-获取对象中的程序信息.zip
- 任务、日程管理app ui .fig素材下载
- ant-design-vue-4.0.8.zip
- 通风与空调工程施工组织设计-空调工程施工组织设计