改进的CNN行人检测:模拟视觉注意力,提升96.14%-99.78%准确率
需积分: 10 15 浏览量
更新于2024-09-07
收藏 4.77MB PDF 举报
本文主要探讨了"改进的卷积神经网络在行人检测中的应用"这一主题,由谢林江等人提出。针对现有的行人检测方法存在的挑战,如计算量大、行人特征提取复杂以及受复杂背景干扰等问题,研究者们设计了一种创新的CNN模型。传统的CNN算法被作为基础,通过引入选择性注意层来模拟人类视觉系统中注意力的聚焦特性,从而有效地抑制背景噪声,强化行人特征的识别。
在这个改进的模型中,LBP(局部二值模式)纹理处理和梯度处理被用来对选择性注意层进行训练,这两种方法旨在进一步提升模型对行人特征的敏感性和区分度。通过这种方式,模型能够更加精确地定位和识别行人,减少误检和漏检的可能性。
实验部分在INRIA、NICTA和Daimler行人数据集上进行了深入验证。结果表明,与传统的CNN、基于HOG(方向梯度直方图)和SVM(支持向量机)的方法,如HOG+SVM和Haar+SVM,以及PCA+SVM等相比,改进的CNN模型在行人检测任务中表现显著优越。在INRIA数据集上,检测准确率达到了96.14%,在NICTA数据集上为96.64%,而在Daimler数据集上更是高达99.78%,显示出该模型在复杂场景下具有较高的鲁棒性和准确性。
总结来说,这篇文章的核心贡献在于提出并优化了一个结合选择性注意机制的CNN模型,通过结合纹理和梯度处理提高了行人检测的性能,尤其是在面对复杂背景时。这对于实际应用中的行人检测系统,如自动驾驶、视频监控等领域具有重要的意义,为进一步提升行人检测的效率和精度提供了新的思路和技术支持。
2022-08-04 上传
2021-06-02 上传
2024-09-24 上传
2024-09-24 上传
2024-09-24 上传
2024-09-24 上传
2024-09-24 上传
看雨闻声
- 粉丝: 0
- 资源: 1
最新资源
- Ansys Comsol实现力磁耦合仿真及其在电磁无损检测中的应用
- 西门子数控系统调试与配置实战案例教程
- ELM多输出拟合预测模型:简易Matlab实现指南
- 一维光子晶体的Comsol能带拓扑分析研究
- Borland-5技术资料压缩包分享
- Borland 6 技术资料分享包
- UE5压缩包处理技巧与D文件介绍
- 机器学习笔记:深入探讨中心极限定理
- ProE使用技巧及文件管理方法分享
- 增量式百度图片爬虫程序修复版发布
- Emlog屏蔽用户IP黑名单插件:自定义跳转与评论限制
- 安装Prometheus 2.2.1所需镜像及配置指南
- WinRARChan主题包:个性化你的压缩软件
- Neo4j关系数据映射转换测试样例集
- 安装heapster-grafana-amd64-v5-0-4所需镜像介绍
- DVB-C语言深度解析TS流