深度度量学习:改进人体运动相似性评估

0 下载量 155 浏览量 更新于2024-06-20 收藏 1.16MB PDF 举报
"本文探讨了深度度量学习在评估人类运动相似性方面的应用,对比传统方法,如L2距离和动态时间扭曲,深度度量学习能更好地捕捉运动的语义关系。研究中提出了一种结合三元组架构和最大均值差异的新型度量学习目标,以及专注递归神经网络的深度架构,解决了不同输入大小和计算成本高的问题。实验结果在两个数据集上显示了显著的性能提升,证明了该方法的有效性。" 在计算机视觉领域,准确评估人类运动的相似性对于诸如步态分析、人物识别和动作检索等任务至关重要。传统方法,如L2距离和动态时间扭曲,虽然在局部姿势匹配上有一定效果,但它们往往无法充分捕捉到不同运动间的语义关联,尤其在处理跨运动序列的比较时。为了解决这个问题,研究者们转向了深度度量学习。 深度度量学习是一种利用深度神经网络学习特征表示的方法,它能学习到更具语义意义的特征,从而更好地衡量不同运动之间的相似性。本文提出了一种基于三元组的框架,其中包含一个正样本、一个负样本和一个锚点,通过最大化正样本与锚点的距离,同时最小化负样本与锚点的距离,来优化网络的训练。此外,他们引入了最大均值差异作为损失函数,这一目标函数有助于在不同运动类别间实现更好的分离,确保相似运动的嵌入更接近,而不同运动的嵌入更分散。 针对运动数据的输入大小不一致和计算效率问题,研究者设计了一种专注递归神经网络(Focussed Recurrent Neural Network)。这种网络能够将不同大小的输入转化为固定大小的嵌入,并且能够专注于学习运动序列中的语义独特部分,无论序列长度如何,都能有效地处理。 实验部分,作者在两个不同的数据集上验证了所提方法的性能,结果显示,与传统的运动指标相比,新方法在衡量人类运动相似性方面有显著的改进。这些结果表明,深度度量学习和专注递归神经网络的结合为解决跨序列姿势相似性评估的挑战提供了有效途径,有望在相关领域得到广泛应用。