多特征融合的RGB-D动作识别方法

23 浏览量更新于2024-08-27 1 收藏 1.14MB PDF 举报

"基于多特征融合的动作识别方法" 本文是一篇研究论文，主要探讨了一种新的基于多特征融合的人体动作识别技术。该方法利用了RGB-D图像序列，结合深度特征和时空特征，通过随机森林学习框架进行有效的动作识别。作者石祥滨及其团队来自沈阳航空航天大学计算机学院和辽宁大学信息学院，他们的研究工作得到了多项基金的支持。在方法的具体实现中，首先从深度图像序列中检测和获取人的关键关节位置，以此为基础提取出两种新的深度特征——位移特征和部件中心特征。位移特征描述了人体关节在时间序列中的运动轨迹，而部件中心特征则反映了人体各部位的三维结构信息。这两种特征共同作用，能够更全面地捕获人体动作的动态变化。接着，研究人员从RGB图像序列中提取稠密轨迹，通过这一过程可以筛选出前景中的轨迹，减少背景的干扰。然后，他们采用词袋模型(Bag-of-Words, BoW)构建时空特征，这是一种常用的数据表示方法，能有效捕捉帧间的运动模式和动作的连续性。最后，为了融合上述两种互补的特征，研究者应用了随机森林学习框架。随机森林是一种集成学习方法，具有鲁棒性和高效性，能够处理高维度数据，并有效地降低过拟合风险。通过训练随机森林模型，将深度特征和时空特征结合起来，提高了动作识别的准确性。实验部分，作者在MSR DailyActivity3D数据集上验证了该方法的有效性，这个数据集包含多种日常活动，是评估RGB-D图像序列动作识别算法的常见基准。结果显示，所提出的多特征融合方法在动作识别任务中表现出色，证明了其在实际应用中的潜力。总结起来，这篇论文的核心贡献在于提出了一种创新的多特征融合策略，将深度图像的结构信息和RGB图像的运动信息有效地结合起来，以提升人体动作识别的性能。这种方法对于视频监控、人机交互、虚拟现实等领域具有重要的理论和实践意义。

始研究基于深度图像的动作识别方法ꎮ 深度图像

是反映物体到镜头平面距离的一个图像通道ꎬ克

服了自然图像单目识别的缺点ꎬ可以有效避免由

于光照、遮挡等环境因素的影响ꎬ图像序列中目标

的三维结构信息可以通过深度特征进行准确地描

述ꎮ Ｓｈｏｔｔｏｎ等人

[４－５]

提出一种对象识别方法ꎬ设

计一种中间部位的表示方式ꎬ将复杂的姿态估计

问题映射到简单的逐个像素分类问题ꎬ该方法可

以从一张深度图像中快速并准确地估计出人体骨

架关节点的三维位置ꎮ Ｒａｐｔｉｓ等人

[１２]

提出一种

新的模型ꎬ将一个动作模式化为一个局部稀疏序

列ꎬ序列中的关键帧是图像序列中人物部分关键

姿态的集合ꎬ用该稀疏序列对动作序列中的关键

状态进行描述ꎮ Ｒａｈｍａｎｉ等人

[１３]

提出一种新的

描述子ＨＯＰＣ ( ＨｉｓｔｏｇｒａｍｏｆＯｒｉｅｎｔｅｄＰｒｉｎｃｉｐａｌ

Ｃｏｍｐｏｎｅｎｔｓ)和一种关键点检测方法ＳＴＫＰｓ(Ｓｐａ￣

ｔｉｏ￣ＴｅｍｐｏｒａｌＫｅｙ￣Ｐｏｉｎｔｓ)ꎬ 在提升动作识别的准

确率和速度的同时ꎬ识别过程也更加鲁棒ꎮ Ｖｅ￣

ｍｕｌａｐａｌｌｉ

[１４]

等人提出一种基于人体部件之间三

维几何关系的表示方法ꎬ这种表示方法可以明确

模拟存在于人体部件之间经过旋转平移的三维空

间几何关系ꎮ Ｌｕ等人

[１５]

提出一种二进制深度特

征ꎬ在加快动作识别速度的同时ꎬ避免由于测量、

背景以及观察角度的遮挡与旋转等外界因素的变

化对动作识别准确率造成的影响ꎮ Ｋｏｎｇ等人

[１６]

提出一种ＢＨＩＭ双线性异构信息机制ꎬ该机制获

取一个共享领域将视觉特征和深度特征进行融合

并提出一种新的低秩双线性分类器进行动作识

别ꎮ ＪｉａｗｅｉＬｉ等人

[１７]

根据关节点运动特征的相

似性ꎬ将人的身体分成几个集群ꎬ对每一个集群进

行特征提取和动作分类ꎬ利用逻辑回归为每一个

特征计算出一个权值ꎬ将权值最大的类别作为分

类结果ꎮ Ｅ􀆰 Ｍｏｈａｍｍａｄｉ等人

[１８]

首先使用多样特

征集从不同角度对支持向量机进行训练ꎬ然后将

各单一的ＳＶＭ用于代数结合和Ｄ－Ｓ融合ꎬ综合

单一分类器的输出结果ꎬ使得识别结果更加准确ꎬ

算法整体框架更加鲁棒实用ꎮ ＹａｎｇＷａｎｇ等人

提出一种反向动作识别方法

[１９]

ꎬ利用无动作信息

的数据集对无动作分类器进行训练ꎬ使得无动作

分类器可以准确筛选掉不相关的视频片段ꎬ进而

提高动作识别系统的效率ꎮ ＪａｖｅｄＩｍａｒｎ等人提

出一个四通道卷积神经网络

[２０]

ꎬ第一个通道用于

处理运动历史图像ꎬ其余３个通道分别用于处理

主视、侧视和俯视３个角度的深度图像数据ꎮ

根据上述基于ＲＧＢ图像序列和基于深度图

像序列动作识别方法的总结ꎬ提出利用随机森林

学习框架融合ＲＧＢ－Ｄ图像序列中的时空与深

度两种互补特征ꎮ 本文提出的位移特征和部件中

心特征可以全面有效地描述人在发生运动时的三

维结构信息ꎬ通过随机森林与描述表观信息的时

空特征进行融合ꎬ不仅可以提升动作识别的准确

率ꎬ还可以保证识别过程的鲁棒性ꎮ

２　特征提取

本文使用２种互补特征分别描述人的三维结

构信息和表观信息ꎮ 将位移特征和部件中心特征

共同作为新的深度特征更准确地描述人的三维结

构信息ꎮ 本节详细描述了本文提出算法所需要的

深度特征和时空特征以及两种特征的提取过程ꎮ

２􀆰 １　深度特征

本文提出两种新的深度特征:位移特征和部

件中心特征ꎮ 利用位移描述两个关节点之间存在

的相对运动ꎬ利用部件中心特征捕获身体部件中

心点的时序运动信息ꎮ 使用两种深度特征共同描

述人体发生运动时的三维结构信息ꎮ

由于获取的图像序列数据较长ꎬ首先对图像

序列进行分割处理ꎬ从每一个深度图像序列中平

均采样Ｄ幅深度图像作为关键帧ꎬ提取关键帧中

人的骨架关节点坐标ꎮ 若一幅深度图像中的骨架

关节点坐标为ｄ维ꎬ则整个图像序列的深度特征

为Ｄ∗ｄ维ꎮ

２􀆰 １􀆰 １　位移特征

从由Ｋｉｎｅｃｔ获取的深度图像序列中选取１５

个关节点位置信息用于深度特征的提取ꎮ 如图２

所示ꎮ 图中关节点Ａ ~ 关节点Ｏ分别代表人的

髋中心、肩中心、头、左肩、左肘、左手、右肩、右肘、

右手、左髋、左膝、左脚、右髋、右膝、右脚ꎮ 每一幅

关键帧图像中人的关节点位置坐标可以表示为式

(１):

ｊｏｉｎｔｓ＝ {( ｘ

Ａ

ꎬｙ

Ａ

ꎬｚ

Ａ

)ꎬ ( ｘ

Ｂ

ꎬｙ

Ｂ

ꎬｚ

Ｂ

)ꎬ 􀆺ꎬ( ｘ

Ｏ

ꎬ

ｙ

Ｏ

ꎬｚ

Ｏ

)} (１)

３

剩余10页未读，继续阅读

weixin_38673812

粉丝: 4
资源: 904

多特征融合的RGB-D动作识别方法

基于多特征融合的自适应核目标跟踪方法

多种特征提取方法代码

一种基于多种特征融合的人脸识别算法

基于骨骼及表观特征融合的动作识别方法.docx

基于多特征融合和分层反向传播增强算法的人体动作识别 (2014年)

基于多特征融合及Transformer的人体跌倒动作检测算法.docx

基于深度学习的时空特征融合人体动作识别.pdf

毕业设计基于多特征融合的微表情识别python源码+部署说明.zip

基于深度学习的动作识别方法简述.pdf

电信设备-基于双通道红外信息融合的人体动作识别方法.zip

最新资源