关键帧双流卷积网络在人体动作识别中的应用
131 浏览量
更新于2024-08-27
1
收藏 979KB PDF 举报
"这篇研究论文探讨了一种基于关键帧双流卷积网络的人体动作识别方法,旨在解决视频序列中人体动作识别的信息冗余大、准确率低的问题。该方法利用VGG16网络模型提取RGB图像和光流图像的深度特征,并通过关键帧提取减少冗余信息,最后通过特征融合提高识别效率。实验结果在UCF-101数据集上显示,此方法相比主流方法有更高的识别率和更低的网络复杂度。"
详细说明:
该论文介绍了一种创新的人体动作识别技术,主要针对视频分析领域。传统的视频处理方法常常面临信息冗余和识别准确率低的挑战。为了解决这些问题,研究者提出了一个基于关键帧的双流卷积网络框架。
这个框架包括三个核心模块:特征提取、关键帧提取和时空特征融合。首先,利用VGG16这种深度卷积神经网络模型,对视频的空间域(RGB图像)和时间域(光流图像)进行特征提取,获取视频的深度特征。这一步骤有助于理解视频中的视觉和动态信息。
接着,通过预测每个视频帧的重要性,选取关键帧,即那些包含最多动作信息的帧。这种方法可以减少不必要的计算负担,因为非关键帧往往包含大量冗余信息。关键帧的选择策略使得网络仅需处理最相关的部分,从而降低了计算复杂性。
最后,将两部分(RGB图像和光流图像)的特征通过Softmax函数进行加权融合,作为最终的输出结果。这种多模型融合策略能够更全面地捕捉到视频中的时空信息,进一步提升动作识别的准确性。
在UCF-101公开数据集上进行的实验验证了该方法的有效性。相比于现有的主流人体动作识别方法,该方法显示出更高的识别率,并且由于减少了处理的帧数,网络的复杂度也相对降低。这表明,该方法在实际应用中既能提高识别性能,又能减少计算资源的需求,特别是在大数据集和实时监控场景下。
关键词涉及的关键技术包括关键帧选择、双流网络(分别处理空间和时间信息)、动作识别、特征提取以及特征融合。这些技术的应用领域广泛,如机器人交互、虚拟现实、视频监控等。
该研究得到了国家自然科学基金和北京市自然科学基金的支持,作者们来自北京联合大学的机器人学院和智慧城市学院,他们的研究方向集中在数字图像处理领域。
124 浏览量
2021-09-19 上传
2021-09-25 上传
105 浏览量
2022-11-28 上传
1524 浏览量
点击了解资源详情
2021-09-25 上传
2022-11-28 上传
weixin_38630139
- 粉丝: 3
- 资源: 934
最新资源
- Gooper1 Data Pack:新的 G1DP 存储库。 去贡献!-开源
- iOS Apprentice v7.0 (iOS12 & Swift4.2 & Xc.zip
- PersonalPage:我的NextJS个人开发人员页面
- CS300P07
- AppAuth-JS:JavaScript客户端SDK,用于与OAuth 2.0和OpenID Connect提供程序进行通信
- js和CSS3炫酷圆形导航菜单插件
- 裂纹检测:使用计算机视觉工具箱进行裂纹检测-matlab开发
- 开源软路由OPENWRT2020.9.8原版VMWARE固件
- Onboard-SDK:DJI Onboard SDK官方资料库
- projetoFinal-ips-2-ano
- chips_thermal_face_dataset:芯片热敏面数据集是一个大规模的热敏面数据集(来自3个不同大洲的1200幅男性和女性图像,年龄在18-23岁之间)。 该数据集将可供全世界的研究人员使用最新的深度学习方法创建准确的热面部分类和热面部识别系统
- pamansayurdev.github.io:网站paman sayur
- MO_Ring_PSO_SCD:它是用于多模态多目标优化的多目标 PSO-matlab开发
- resynthesizer:用于纹理合成的gimp插件套件
- NavigationDrawer:这是一个示例项目,用于演示如何制作导航抽屉。此外,在这个项目中,我添加了材料设计,因此对于想要实现材料设计、工具栏等的人也有帮助
- hacker-news-clone