RGB-D动作识别:深度双线性学习新框架

0 下载量 179 浏览量 更新于2024-06-20 收藏 1.32MB PDF 举报
"本文主要探讨了使用深度双线性学习方法进行RGB-D动作识别的研究,强调了结合RGB、深度和骨架数据对提升动作识别性能的重要性。文中提出了一种新的深度双线性学习框架,该框架包含双线性块,通过线性池化层处理输入的立方体特征,从模态和时间维度进行信息融合。此外,还创新性地引入了模态时间立方体作为动作特征,以全面表征RGB-D动作。实验结果显示,该方法在多个公共数据集上的表现优于现有的先进方法。" 深度双线性学习在RGB-D动作识别中的应用是一个重要的研究领域,尤其是在结合了低成本深度相机如Kinect的数据后,能够提供更丰富的信息源。RGB-D数据包含了颜色信息(RGB)以及深度信息,这使得对动作的几何和视觉理解更为全面。传统的RGB相机只能提供颜色信息,而深度相机则可以提供3D空间位置,这对于理解人的运动轨迹和姿态至关重要。 文中提到的深度双线性学习框架是为了解决如何有效地融合模态间的信息和时间变化的问题。在这个框架内,双线性块设计有两个线性池化层,分别从模态和时间维度对输入立方体特征进行池化操作,旨在捕捉到模态间的交互信息和动作的时间演变。这种设计有助于提取出更具代表性的特征,从而提高识别准确性。 模态时间立方体是文章提出的新型动作特征,它在张量结构中捕捉丰富的模态和时间信息。通过这种方式,RGB-D数据的多模态特性被充分挖掘,不仅考虑了不同模态的数据,还考虑了动作的动态变化,为每个动作提供了全面的描述。 实验部分,作者在两个公开数据集上进行了多设置的评估,结果证明了所提方法在RGB-D动作识别任务上相对于现有最佳方法的优越性。这些成果对于进一步推动基于深度学习的动作识别技术发展,特别是在多模态数据融合和深度特征学习方面,有着积极的贡献。 关键词:深度双线性学习、RGB-D动作识别、特征学习、立方体特征。这些关键词突出了本文的核心研究内容和技术手段,即利用深度学习方法处理RGB-D数据,特别是通过双线性和立方体特征来增强动作识别的效率和准确性。