四元数3D骨骼表示在人体行为识别中的应用

5 下载量 35 浏览量 更新于2024-08-30 1 收藏 6.21MB PDF 举报
"该文提出了一种基于四元数3D骨骼表示的人体行为识别方法,旨在精确描述人体骨骼运动细节及3D骨骼间的几何关系。通过线性插值和二次多项式插值处理关键帧,得到骨骼序列,并用四元数描述3D骨骼间的关系,形成四元数骨骼特征描述子。最后,利用支持向量机进行分类器训练和测试,以实现行为识别。实验表明,这种方法对噪声、速度变化、视角变化和时间对齐问题有很好的鲁棒性,能有效提高识别准确性。" 文章详细讨论了人体行为识别领域的一种创新方法,该方法利用四元数来表达3D骨骼的动态信息。四元数是一种数学概念,常用于表示旋转和平移,特别适合描述三维空间中的角度和方向。在本文中,四元数被用来描述每个关键帧中3D骨骼之间的几何关系,这样可以捕捉到更精细的运动细节。 首先,研究者从捕获的关键帧集合出发,对关键帧进行处理。对于普通关键帧,他们使用线性插值来生成平滑的骨骼运动轨迹;而对于变速关键帧,采用二次多项式插值,以适应速度的变化。这种插值技术使得不同速度下的骨骼运动能够均匀地表示在同一时间轴上,从而创建了一个等帧数的骨骼序列。 接下来,他们利用四元数来描述每帧骨骼间的相对位置和旋转。四元数骨骼特征描述子可以捕获复杂的3D空间变换,而且比传统的欧几里得坐标系统更具优势,因为它避免了万向节死锁问题,即在某些旋转组合下可能出现的方向不连续性。 最后,这些特征描述子被输入到支持向量机(SVM)分类器中进行训练和测试。SVM是一种强大的监督学习模型,擅长处理分类问题,尤其在小样本数据集上表现出色。通过SVM,可以从大量的特征描述子中学习到有效的分类边界,从而实现对人体行为的准确识别。 实验在三个标准数据库上验证了该方法的有效性,结果显示,四元数骨骼特征描述子对各种噪声干扰、运动速度变化、视角变化以及时间对齐问题具有良好的稳健性。这意味着在实际应用中,即使在复杂环境条件下,该方法也能提供高精度的行为识别结果,提升了识别的可靠性。 总结来说,这篇论文提出了一种基于四元数的3D骨骼表示方法,通过结合关键帧插值技术和四元数几何关系描述,再配以支持向量机的分类能力,实现了对人体行为的高效且准确的识别。这种方法对于增强人体行为识别系统的性能,特别是在复杂和动态的环境中有重要的应用价值。