人体动作识别新方法:基于pLSA的主题模型

需积分: 9 2 下载量 86 浏览量 更新于2024-09-08 收藏 742KB PDF 举报
"这篇论文是夏利民、黄金霞和罗大庸合作的研究成果,探讨了基于pLSA(概率潜在语义分析)的人体动作识别技术。他们提出了一种新方法,首先利用时空兴趣点(STIP)来捕捉人体运动的特征,随后引入时间-梯度直方图(T-HOG)算法来补充传统HOG算法在描述3D区域立方体时间变化方面的不足。通过pLSA模型进行动作识别,并通过监督学习确保主题与动作标签的对应关系,以提高识别准确性。实验在KTH和Weizmann数据库上进行,识别正确率超过91.50%。关键词包括主题模型、动作识别、STIP、梯度直方图和隐性主题。" 这篇论文的研究重点在于人体动作识别,这是一种计算机视觉领域的关键技术,用于理解和解析人类在视频中的动态行为。论文提出的是一种基于主题模型的识别方法,特别是使用了pLSA,这是一种统计建模技术,通常用于文本挖掘,但在这里被创新性地应用于动作识别。 时空兴趣点(STIP)是人体动作识别中的重要特征,它能够捕捉到运动的关键时空间位置。STIP描述了运动的局部特征,对于动作识别至关重要。然而,仅依赖STIP可能无法完全捕捉到动作的时间演变信息,因此,论文提出了时间-梯度直方图(T-HOG)算法。HOG算法通常用于物体检测,通过计算图像梯度的方向和强度来形成直方图,而T-HOG则扩展了这一概念,不仅考虑空间信息,还包含了时间维度的变化,增强了对动作序列的理解。 pLSA模型在识别过程中起到了核心作用。pLSA可以发现数据隐藏的主题结构,将观察到的变量(如视频帧)分解为潜在主题和主题的概率分布。在动作识别中,每个主题可以对应于一种特定的动作。然而,pLSA的隐性主题并不总是与实际的动作标签相对应,为此,论文采用了监督学习策略,将每个主题与一个动作标签一对一关联,从而保证了训练过程中主题的正确性。 实验结果表明,这种方法在KTH和Weizmann这两个标准人体动作数据库上的表现优秀,识别准确率超过91.50%,显示出其在动作识别领域的潜力和有效性。这为后续的计算机视觉研究和应用,特别是在安全监控、人机交互以及智能视频分析等领域提供了有价值的理论和技术支持。