RGB-D图像中行人检测的新型深度描述符

5星 · 超过95%的资源需积分: 0 76 浏览量更新于2024-09-11 1 收藏 2MB PDF 举报

"本文介绍了2012年ICPR会议上发表的一种新型深度描述子，用于RGB-D图像中的行人检测。文章作者来自浙江大学信息与电子工程系，他们提出了一种名为Pyramid Depth Self-Similarities (PDSS)的新特征描述符，该描述符基于人体深度信息具有高局部自相似性的原理。实验表明，PDSS可以有效地补充Histogram of Oriented Depth (HOD)，并且结合Histogram of Oriented Gradients (HOG)、HOD和PDSS能提升行人检测的性能。" 在计算机视觉领域，行人检测是一项至关重要的任务，它广泛应用于自动驾驶、视频监控、人机交互等多个场景。随着深度相机技术的发展，实时获取高质量的彩色和深度图像变得可行，RGB-D图像因此成为行人检测的新研究热点。然而，如何从这些数据中提取有效的特征来识别行人仍然是一个挑战。传统的二维图像特征如HOG（方向梯度直方图）在处理二维色彩图像时表现良好，但它们往往无法充分利用深度信息。为了克服这一局限，研究人员开始探索深度图像的描述子，例如HOD，它利用深度信息的方向分布来表征图像区域。然而，HOD可能不足以捕捉深度图像的所有重要细节。在这种背景下，文章提出了PDSS特征描述符。PDSS基于深度信息的局部自相似性，即同一人体部位在不同尺度下的深度模式往往具有相似性。通过构建金字塔结构，PDSS能够在不同层次上捕捉这种自相似性，从而提供更丰富的深度信息表示。实验部分，作者使用Kinect传感器采集的RGB-D数据进行验证，结果证明PDSS能有效提高行人检测的准确性。进一步地，为了综合利用色彩、深度和形状信息，文章将PDSS与HOG和HOD相结合。HOG特征擅长捕获物体边缘和形状信息，而HOD则关注深度变化的方向。当这三种描述子一起用于行人检测时，它们互补各自的不足，显著提升了整体检测性能。这项工作为RGB-D图像中的行人检测提供了一个强大的特征表示框架，通过深度信息的高效利用，提高了检测的准确性和鲁棒性。这对于推动基于深度图像的计算机视觉应用，特别是行人检测技术的发展，具有重要意义。

masikkk

粉丝: 1628
资源: 105

RGB-D图像中行人检测的新型深度描述符

Pedestrian.zip_SVM_行人检测

Pedestriandetection行人检测工程程序代码.zip

ICPR_TextDection

text-detection-ICPR 文本区域检测

RONELD-Lane-Detection:RONELD方法的Python实现（ICPR 2020）

Adaptive-Soft-Contrastive-Learning_ICPR2022-main.zip

text_detection_by_CTPN_tianchi_ICPR:阿里巴巴天池OCR比赛

人脸图像特征提取matlab代码-Deep-Difference-Analysis-in-Similar-looking-face-recog

cnn_lstm_ctc_ocr_for_ICPR:从weinmancnn_lstm_ctc_ocr分叉以参加ICPR MTWI 2018挑战赛1

人脸图像特征提取matlab代码-descriptor_vocbenchmark:voicebenchmark_descriptor

最新资源