人体动作识别新方法:基于pLSA的主题模型
需积分: 9 86 浏览量
更新于2024-09-08
收藏 742KB PDF 举报
"这篇论文是夏利民、黄金霞和罗大庸合作的研究成果,探讨了基于pLSA(概率潜在语义分析)的人体动作识别技术。他们提出了一种新方法,首先利用时空兴趣点(STIP)来捕捉人体运动的特征,随后引入时间-梯度直方图(T-HOG)算法来补充传统HOG算法在描述3D区域立方体时间变化方面的不足。通过pLSA模型进行动作识别,并通过监督学习确保主题与动作标签的对应关系,以提高识别准确性。实验在KTH和Weizmann数据库上进行,识别正确率超过91.50%。关键词包括主题模型、动作识别、STIP、梯度直方图和隐性主题。"
这篇论文的研究重点在于人体动作识别,这是一种计算机视觉领域的关键技术,用于理解和解析人类在视频中的动态行为。论文提出的是一种基于主题模型的识别方法,特别是使用了pLSA,这是一种统计建模技术,通常用于文本挖掘,但在这里被创新性地应用于动作识别。
时空兴趣点(STIP)是人体动作识别中的重要特征,它能够捕捉到运动的关键时空间位置。STIP描述了运动的局部特征,对于动作识别至关重要。然而,仅依赖STIP可能无法完全捕捉到动作的时间演变信息,因此,论文提出了时间-梯度直方图(T-HOG)算法。HOG算法通常用于物体检测,通过计算图像梯度的方向和强度来形成直方图,而T-HOG则扩展了这一概念,不仅考虑空间信息,还包含了时间维度的变化,增强了对动作序列的理解。
pLSA模型在识别过程中起到了核心作用。pLSA可以发现数据隐藏的主题结构,将观察到的变量(如视频帧)分解为潜在主题和主题的概率分布。在动作识别中,每个主题可以对应于一种特定的动作。然而,pLSA的隐性主题并不总是与实际的动作标签相对应,为此,论文采用了监督学习策略,将每个主题与一个动作标签一对一关联,从而保证了训练过程中主题的正确性。
实验结果表明,这种方法在KTH和Weizmann这两个标准人体动作数据库上的表现优秀,识别准确率超过91.50%,显示出其在动作识别领域的潜力和有效性。这为后续的计算机视觉研究和应用,特别是在安全监控、人机交互以及智能视频分析等领域提供了有价值的理论和技术支持。
2022-05-30 上传
2019-09-08 上传
2023-05-30 上传
2023-06-02 上传
2023-03-26 上传
2024-02-21 上传
2023-11-19 上传
2024-07-26 上传
weixin_39840387
- 粉丝: 789
- 资源: 3万+
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦