RGB-D人体动作识别的耦合隐含条件随机场方法

0 下载量 164 浏览量 更新于2024-08-28 收藏 1.23MB PDF 举报
本文主要探讨了"结合隐藏条件随机场(Coupled Hidden Conditional Random Fields, CHCRFs)的人体动作识别方法",针对RGB-D(红绿蓝深度)多模态数据的处理。作者An Liua、Wei-Zhi Niea、Yu-Ting Su等来自天津大学电子信息工程学院和天津师范大学生命科学学院的研究者,提出了一个创新性的模型,将标准的单链结构序列观察扩展到多个同步的链结构序列,以融合RGB和深度图像中的时空上下文信息。 CHCRFs模型的核心在于其能够在处理不同模态(如RGB图像中的颜色和深度图像中的形状)时,捕捉到它们之间的协同作用。相比于传统的单一模态方法,这种方法能够充分利用多源数据的互补性,提高动作识别的准确性和鲁棒性。在模型构建过程中,作者特别设计了用于描述不同模态间交互关系的特定图结构,这有助于模型学习到更丰富的特征表示,并在处理复杂动作时捕捉到动态行为的细微变化。 论文的接收日期为2014年2月24日,修订后的版本于同年8月21日接受,最终在线发布日期为2014年9月3日。关键词包括:耦合隐藏条件随机场、多模态、时间上下文、人体动作识别。摘要部分概述了这项工作的主要贡献,即提出了一种新颖的框架,通过CHCRFs模型有效地整合RGB和深度数据,以提升人类动作识别的性能,并强调了模型在处理多模态数据时所展现的优势。 总结来说,这篇研究论文在计算机视觉领域具有重要意义,它不仅推进了RGB-D数据在动作识别中的应用,而且展示了耦合隐藏条件随机场作为一种有效工具,如何在处理复杂场景下的人体动作识别任务中发挥关键作用。通过结合不同模态的时空信息,该模型有望在未来的智能监控、机器人交互和虚拟现实等领域得到广泛应用。