双流卷积神经网络在人体行为识别中的应用
需积分: 50 28 浏览量
更新于2024-08-13
5
收藏 1016KB PDF 举报
"本文介绍了一种基于双流卷积神经网络的人体行为识别方法,用于在未经分割的长视频中检测行为片段的起止时间和类别。该方法通过双流CNN提取视频特征,TAG生成行为提议,边界回归网络修正提议边界,并采用三段式特征和多层感知机进行识别。实验在THUMOS 2014和ActivityNet v1.3数据集上取得良好效果。"
在计算机视觉领域,人体行为识别是关键的研究课题之一,尤其是在监控视频分析、体育赛事分析等领域有广泛的应用。传统的行为识别方法通常依赖于手工设计的特征,而近年来,随着深度学习的发展,尤其是卷积神经网络(CNN)的引入,这一领域取得了显著的进步。
双流卷积神经网络(Two-Stream Convolutional Networks)是一种专为处理视频数据设计的深度学习架构,由两个独立的CNN分支构成。一个分支处理视频的RGB帧,捕获空间信息,如形状和颜色;另一个分支处理光流图,捕获时间运动信息。这种设计使得模型能够同时利用静态图像和动态运动来理解视频中的行为。
在本文中,研究人员提出了一个行为检测模型,它首先通过双流CNN对输入视频进行特征提取,生成反映视频内容的特征序列。接下来,Temporal Actionness Grouping (TAG) 算法被用来生成初步的行为提议,这些提议代表可能的行为实例。然而,这些提议的边界可能不准确,因此将它们输入到边界回归网络中进行调整,以更精确地定位行为的开始和结束时间。
为了增加行为提议的上下文信息,作者采用了三段式特征设计。这种方法将每个行为提议分为起始、主体和结束三个部分,从而提供更多的上下文线索,有助于提高识别的准确性。最后,通过多层感知机(MLP)对这些增强的特征进行分类,以确定行为的类别。
实验结果在THUMOS 2014和ActivityNet v1.3两个标准数据集上验证了该方法的有效性,显示了较高的行为识别率。这表明,基于双流卷积神经网络的模型对于时序行为检测任务具有显著的优势,能够有效地在复杂背景和长时间序列中识别行为。
这个研究展示了深度学习技术如何改进行为识别的性能,特别是通过双流CNN捕捉空间和时间信息,以及通过精细的边界调整和上下文增强策略提高识别准确性。这种方法为实时视频分析和行为识别提供了新的解决方案,未来有望在智能监控、安全防范等应用场景中得到广泛应用。
177 浏览量
144 浏览量
691 浏览量
2021-09-19 上传
135 浏览量
509 浏览量
点击了解资源详情

weixin_38611254
- 粉丝: 4
最新资源
- 小学水墨风学校网站模板设计
- 深入理解线程池的实现原理与应用
- MSP430编程代码集锦:实用例程源码分享
- 绿色大图幻灯商务响应式企业网站开发源码包
- 深入理解CSS与Web标准的专业解决方案
- Qt/C++集成Google拼音输入法演示Demo
- Apache Hive 0.13.1 版本安装包详解
- 百度地图范围标注技术及应用
- 打造个性化的Windows 8锁屏体验
- Atlantis移动应用开发深度解析
- ASP.NET实验教程:源代码详细解析与实践
- 2012年工业观察杂志完整版
- 全国综合缴费营业厅系统11.5:一站式缴费与运营管理解决方案
- JAVA原生实现HTTP请求的简易指南
- 便携PDF浏览器:随时随地快速查看文档
- VTF格式图片编辑工具:深入起源引擎贴图修改