HOG行人检测解析:块内归一化与优化策略

需积分: 13 10 下载量 79 浏览量 更新于2024-07-13 收藏 734KB PPT 举报
"本文主要介绍了HOG(Histograms of Oriented Gradients)特征在行人检测中的应用,重点讲解了块内归一化的概念和方法,包括R-HOG和C-HOG的不同实现方式以及对应的参数设置。同时,文章还提到了前人在此领域的研究,如边缘方向直方图、SIFT描述子和形状上下文等,并概述了测试集的选择和评估标准。" HOG特征是一种广泛用于图像处理和计算机视觉,尤其是行人检测中的特征提取方法。它通过计算图像中像素梯度的方向直方图来捕捉物体的形状和结构信息。HOG特征的计算过程通常包括以下几个步骤: 1. **预处理**:首先,对输入图像进行伽马校正和色彩空间转换,如转为灰度图像或使用LAB和RGB空间,这些预处理有助于提升后续处理的效果。 2. **细胞单元(Cells)**:将图像分割成多个小的单元格,每个单元格内部统计像素的梯度信息。 3. **块(Block)**:将相邻的单元格组合成更大的块,以考虑局部的空间信息。块内归一化是此步骤的关键,它可以减少光照变化和阴影的影响。 - **R-HOG**(Rectangular HOG)采用矩形块,例如2-3个2-3像素宽的细胞构成一个6-8像素宽的块。这是因为人体的肢体在图像中大约有6-8像素宽。为了平滑空间变化,通常会使用高斯窗口,其宽度为块宽度的0.5倍。不同的块大小和排列可以影响性能,但也会增加计算时间。 - **C-HOG**(Circular HOG)采用极坐标系统,更适合处理非刚性形状。C-HOG的参数设置包括角度盒子的数量、半径盒子的数量、中心盒子的半径以及半径的伸展因子,最佳参数通常为4、2、4、2。 4. **方向直方图**:在每个单元格内计算梯度方向的直方图,通常使用9个或16个方向。 5. **归一化**:为了进一步增强特征的鲁棒性,会对直方图进行归一化。常见的归一化方法有L2范数、L1范数、平方根L1范数以及L2-Hys,其中L2-Hys是对L2范数进行截断,防止某些特征值过大。 6. **构造描述符**:将所有块的归一化直方图组合成一个全局特征向量,用于分类或匹配。 7. **训练与测试**:使用标准测试集,如MIT Pedestrian Test Set或INRIA数据集,进行模型的训练和评估。对于INRIA数据集,由于其包含大量不同姿势、外观、照明和背景的行人,可以有效测试模型的泛化能力。 总结来说,HOG特征通过精细地捕获图像的局部梯度信息,结合块内归一化和合适的归一化策略,能够在行人检测任务中取得良好效果。然而,前人的研究也表明,单纯依赖HOG可能需要保留大量的主成分才能保持较高的表现,这可能是因为HOG在没有关键点检测的情况下,空间注册较弱。因此,结合其他技术,如SIFT描述子或形状上下文,可能会提高整体性能。