递归神经网络LSTM-SSD在视频多目标检测中的应用
需积分: 50 64 浏览量
更新于2024-08-13
1
收藏 1.34MB PDF 举报
"基于递归神经网络的视频多目标检测技术,通过结合SSD和LSTM,解决了在低功耗设备上的实时视频目标检测问题。通过Bottleneck-LSTM层实现帧间信息的时序关联,降低了计算成本。同时,利用改进的动态卡尔曼滤波进行目标追踪,有效应对光照变化和遮挡情况。实验结果表明,改进的LSTM-SSD在复杂场景下提高了目标检测的准确率和多目标检测率,达到43 fps的检测帧率,实现了精度和速度的平衡。"
本文主要探讨了一种针对视频多目标检测的创新技术,特别是在低功耗移动和嵌入式设备上的应用。传统的基于深度学习的目标检测框架,如SSD(Single Shot MultiBox Detector),在处理大量数据时,往往存在计算资源需求高、实时性差的问题。为解决这一问题,研究者提出了LSTM-SSD,这是一种融合了递归神经网络(RNN,特别是LSTM,Long Short-Term Memory)和卷积神经网络(CNN)的多目标检测框架。
LSTM-SSD的独特之处在于其交织循环卷积结构,这种结构允许信息在时间维度上流动,即通过Bottleneck-LSTM层来捕捉帧间的特征映射,从而实现帧级信息的时序关联。Bottleneck-LSTM层的设计有效地减少了计算复杂性,使得网络能够在资源有限的设备上高效运行。
此外,为了应对视频中光照变化、大面积遮挡等导致的目标识别困难,该方法引入了时间感知信息,并结合改进的动态卡尔曼滤波算法进行目标追踪。卡尔曼滤波是一种经典的估计理论,用于预测和过滤噪声,而改进的动态版本则增强了其适应性和鲁棒性,尤其在面对光照变化和遮挡等动态环境时。
实验结果证明,改进的LSTM-SSD在多目标、复杂背景、光照变化、模糊和遮挡等挑战性场景下,表现出了显著的提升。平均准确率提高了5%至16%,平均准确率均值提升了4%至10%,多目标检测率提高了4%至19%。检测帧率达到了43 fps,基本满足了实时检测的需求。这些改进不仅提高了检测的准确性,还确保了算法在实际应用中的实时性能,为视频监控、自动驾驶等领域提供了有力的技术支持。
该研究成功地在保持高精度的同时,优化了低功耗设备上视频多目标检测的效率,为未来智能系统的实时视觉处理提供了新的思路和解决方案。
2018-10-13 上传
2021-09-26 上传
2021-04-12 上传
2021-03-30 上传
2021-09-26 上传
2021-09-25 上传
2021-09-25 上传
2021-03-20 上传
2021-09-19 上传
weixin_38583286
- 粉丝: 2
- 资源: 936
最新资源
- C++ Qt影院票务系统源码发布,代码稳定,高分毕业设计首选
- 纯CSS3实现逼真火焰手提灯动画效果
- Java编程基础课后练习答案解析
- typescript-atomizer: Atom 插件实现 TypeScript 语言与工具支持
- 51单片机项目源码分享:课程设计与毕设实践
- Qt画图程序实战:多文档与单文档示例解析
- 全屏H5圆圈缩放矩阵动画背景特效实现
- C#实现的手机触摸板服务端应用
- 数据结构与算法学习资源压缩包介绍
- stream-notifier: 简化Node.js流错误与成功通知方案
- 网页表格选择导出Excel的jQuery实例教程
- Prj19购物车系统项目压缩包解析
- 数据结构与算法学习实践指南
- Qt5实现A*寻路算法:结合C++和GUI
- terser-brunch:现代JavaScript文件压缩工具
- 掌握Power BI导出明细数据的操作指南