LC-YOLO:基于YOLO、LSTM和CNN的智能监控行为识别

需积分: 10 18 下载量 17 浏览量 更新于2024-09-08 收藏 2.2MB PDF 举报
"该文提出了一种名为LC-YOLO的行为识别算法,它结合了YOLO(You Only Look Once)的实时目标检测能力,LSTM(Long Short-Term Memory)的序列建模以及CNN(Convolutional Neural Network)的深度特征提取,用于智能监控场景下的人体行为识别。该算法首先利用YOLO快速定位行为对象,然后通过CNN提取深度特征,再用LSTM处理时间序列信息,以提升识别准确性和效率。在KTH和MSR公开行为识别数据集上的实验结果显示,平均识别率高达96.6%,平均识别速度为215ms,证明了该方法的有效性。" 本文主要讨论了智能监控领域的行为识别技术,针对提高识别准确性和效率的需求,作者马钰锡等人提出了LC-YOLO算法。该算法结合了三种关键技术:YOLO、LSTM和CNN。YOLO是一种实时目标检测模型,能够在一次扫描中完成目标检测,大大提升了处理监控视频的速度。LSTM是递归神经网络的一种,特别适合处理时间序列数据,如视频中的连续行为动作。CNN则擅长从图像中提取深层次的特征。 在LC-YOLO算法中,首先运用YOLO对监控视频进行实时分析,检测出行为发生的区域,获取目标物体的大小和位置。接着,通过CNN对检测到的目标进行深度特征提取,这一过程能够提取出有助于行为识别的关键信息,减少无关背景的干扰。最后,LSTM被用来处理这些特征序列,捕捉行为的动态变化,从而实现对连续行为序列的准确识别。 实验部分,作者在KTH和MSR两个公开的数据集上验证了LC-YOLO算法的性能。这两个数据集包含了多种不同的行为类别,为算法提供了多样性的测试环境。结果显示,LC-YOLO在行为识别的准确性和速度上都表现出色,平均识别率达到了96.6%,这意味着在大多数情况下,算法能正确识别出监控视频中的行为。同时,平均215毫秒的识别速度表明,算法不仅准确,而且运行高效,满足了实时监控的需求。 LC-YOLO算法结合了目标检测、深度学习和序列建模的优势,为智能监控系统提供了一种有效的行为识别解决方案,对于提高监控系统的智能化水平和应用价值具有重要意义。