纹理特征与深度学习提升行人检测算法的性能

54 浏览量更新于2024-09-03 收藏 661KB PDF 举报

本文主要探讨了行人检测算法中的问题，并提出了一个创新的解决方案，即结合纹理特征和深度学习的方法。传统的行人检测算法在处理特征鲁棒性和非线性数据拟合能力方面存在不足，这可能导致在复杂环境或有微小扰动的情况下，检测效果受到影响。为解决这些问题，作者张阳设计了一种改进的GSRLBP（Graduated Signed Rotation of Local Binary Patterns）纹理特征提取算法。GSRLBP算法增强了对行人图像局部纹理特征的提取，通过对像素点梯度信息的考虑，有效抵抗了微小扰动对特征提取的干扰，从而提高了特征提取的鲁棒性。接着，文章构建了一个基于深度学习的行人样本分类器，采用深信度网络（Deep Belief Network，DBN）作为核心架构。该模型包括多层受限波兹曼机（Restricted Boltzmann Machines，RBMs）用于输入端和中间层，它们能够逐步转化和传递行人纹理特征信息，实现了特征数据的自学习过程。这样的设计有助于捕捉和理解行人图像的深层次特征，提升分类器的准确性。 BP（Back Propagation，反向传播）神经网络被用来作为分类器的输出端，通过自优化的方式调整网络结构，使得分类器能够更有效地识别行人。这种方法的优势在于它能够自动学习并适应数据的复杂性，避免了浅层机器学习算法可能面临的过拟合问题。实验结果显示，这种结合纹理特征和深度学习的行人检测算法表现出很高的可行性和有效性，其性能明显优于经典的浅层机器学习方法。这表明深度学习技术在行人检测任务中具有显著的优势，特别是在处理复杂场景和噪声数据时。本文的研究不仅提升了行人检测的准确性和鲁棒性，也为计算机视觉领域的行人检测算法提供了新的思考方向，特别是在深度学习与传统特征融合的道路上迈出了重要的一步。

展开