递归神经网络LSTM-SSD在视频多目标检测中的应用

需积分: 50 70 浏览量更新于2024-08-13 1 收藏 1.34MB PDF 举报

"基于递归神经网络的视频多目标检测技术，通过结合SSD和LSTM，解决了在低功耗设备上的实时视频目标检测问题。通过Bottleneck-LSTM层实现帧间信息的时序关联，降低了计算成本。同时，利用改进的动态卡尔曼滤波进行目标追踪，有效应对光照变化和遮挡情况。实验结果表明，改进的LSTM-SSD在复杂场景下提高了目标检测的准确率和多目标检测率，达到43 fps的检测帧率，实现了精度和速度的平衡。" 本文主要探讨了一种针对视频多目标检测的创新技术，特别是在低功耗移动和嵌入式设备上的应用。传统的基于深度学习的目标检测框架，如SSD（Single Shot MultiBox Detector），在处理大量数据时，往往存在计算资源需求高、实时性差的问题。为解决这一问题，研究者提出了LSTM-SSD，这是一种融合了递归神经网络（RNN，特别是LSTM，Long Short-Term Memory）和卷积神经网络（CNN）的多目标检测框架。 LSTM-SSD的独特之处在于其交织循环卷积结构，这种结构允许信息在时间维度上流动，即通过Bottleneck-LSTM层来捕捉帧间的特征映射，从而实现帧级信息的时序关联。Bottleneck-LSTM层的设计有效地减少了计算复杂性，使得网络能够在资源有限的设备上高效运行。此外，为了应对视频中光照变化、大面积遮挡等导致的目标识别困难，该方法引入了时间感知信息，并结合改进的动态卡尔曼滤波算法进行目标追踪。卡尔曼滤波是一种经典的估计理论，用于预测和过滤噪声，而改进的动态版本则增强了其适应性和鲁棒性，尤其在面对光照变化和遮挡等动态环境时。实验结果证明，改进的LSTM-SSD在多目标、复杂背景、光照变化、模糊和遮挡等挑战性场景下，表现出了显著的提升。平均准确率提高了5%至16%，平均准确率均值提升了4%至10%，多目标检测率提高了4%至19%。检测帧率达到了43 fps，基本满足了实时检测的需求。这些改进不仅提高了检测的准确性，还确保了算法在实际应用中的实时性能，为视频监控、自动驾驶等领域提供了有力的技术支持。该研究成功地在保持高精度的同时，优化了低功耗设备上视频多目标检测的效率，为未来智能系统的实时视觉处理提供了新的思路和解决方案。

weixin_38583286

粉丝: 2
资源: 936

递归神经网络LSTM-SSD在视频多目标检测中的应用

CV object detection目标检测近几年论文和模型

递归神经网络多目标跟踪技术.pdf

不确定噪声条件下基于递归神经网络的鲁棒调制分类

基于单流递归卷积神经网络的RGB-D图像显着目标检测

基于递归卷积神经网络的煤矿智能监控安全生产管理平台关键技术研究.pdf

基于递归卷积神经网络的移动机器人定位算法.pdf

基于卷积和递归神经网络融合的交通状态指数预测.pdf

使用联合分类-回归递归神经网络进行在线人为行为检测

网络游戏-基于神经网络与多特征融合的粒子滤波目标检测跟踪算法研究.zip

多尺度递归卷积神经网络的人群分布估计

最新资源