RGB-D活动识别:联合学习异构特征

0 下载量 17 浏览量 更新于2024-07-14 收藏 1.52MB PDF 举报
"本文主要探讨了异构特征学习在RGB-D活动识别中的应用,提出了一个联合学习模型,以挖掘不同特征通道(RGB和深度)之间的共享和特定成分。通过构建一个统一框架,该模型能共同挖掘等维度子空间,量化子空间中的共享和特定特征,并进行特征集间的互变转换。此外,还介绍了一个三步迭代优化算法来有效训练模型,并在四个活动数据集上验证了其有效性。文章进一步扩展到了人与人交互的RGB-D活动数据集,增加了识别的挑战性。" 在RGB-D活动识别领域,异构特征学习是一项关键的技术。RGB-D数据包含了彩色图像(RGB)和深度信息,这两种不同类型的特征提供了丰富的视觉信息,但它们的表示方式和结构往往是不同的,即为异构特征。论文指出,尽管这些特征在表面上看似不同,但可能存在共享的隐藏结构。这种隐藏的共享结构可以用来提升活动识别的性能。 为此,作者提出了一种联合学习模型,旨在同时探索异构多任务的共享和特征特定组件。这个模型在单一框架下形成,有三个核心功能: 1) 共同挖掘子空间:模型能发掘具有相同维度的子空间,这些子空间可以帮助提取不同特征通道间的潜在共享特征,增强了特征之间的互补性和融合性。 2) 量化共享和特定组件:模型可以量化子空间中特征的共享部分和特定部分,这对于理解和区分不同特征的贡献至关重要,有助于更准确地识别活动。 3) 特征集的互变转换(i-transforms):模型能学习跨数据集的异构特征融合,通过特征集的互变转换,使得模型能够适应新的或复杂的活动场景。 为了训练这个联合模型,作者设计了一个三步迭代优化算法,它简化了模型的训练过程,提高了训练效率。此外,一个简单的推理模型被用于后续的预测阶段,确保了模型在实际应用中的实用性。 实验结果表明,提出的联合学习模型在四个活动数据集上表现出色,证明了这种方法的有效性。特别是对于人与人交互的RGB-D活动识别,这是一个更具挑战性的领域,因为这类活动往往涉及到复杂的空间关系和动作配合,而该模型的性能依然得到了验证。 总结来说,这篇论文为RGB-D活动识别提供了一个创新的解决方案,通过深入挖掘异构特征的共享和特定成分,提高了活动识别的准确性和鲁棒性,对相关领域的研究具有重要的参考价值。