语义约束下的独立手语识别:稀疏编码方法

0 下载量 26 浏览量 更新于2024-08-28 收藏 3.37MB PDF 举报
"本文介绍了一种使用稀疏编码框架的手语识别方法,特别关注于解决签名者独立的手语识别问题。研究中,通过引入语义约束来学习一个能捕获不同签名者之间共性特征的词典。这种方法使得在识别未知签名者的手势时,能够生成兼顾特定手势信息而尽量忽略签名者身份信息的稀疏表示。实验中,每个手势被分割成固定数量的片段,并从这些片段中提取融合了手形和运动轨迹的特征。学习到的词典片段可以看作是手势的基本亚单位,用于编码标志视频的片段。最终,利用支持向量机(SVM)实现识别,通过片段的级联稀疏编码特征。研究表明,该方法在签名者独立的识别问题上比其他基准方法更有效,并且在依赖签名者的情景下也表现良好。" 本文是一篇关于语义约束的词典学习应用于签名者独立的手语识别(SLR)的研究论文。作者提出了一种新的方法,旨在解决手语识别中的关键问题——签名者之间的个体差异。传统的SLR方法往往受制于特定签名者的特征,而新框架利用稀疏编码理论,结合语义约束来学习一个通用的词典,这个词典能够捕捉不同签名者手势的共通特征。 在实施过程中,每个手势首先被分割成多个片段,然后从这些片段中提取融合了手形和运动轨迹的特征。这种特征提取过程有助于捕获手势的本质属性,而非签名者的个人风格。通过学习到的词典,未知签名者的手势可以被编码为一个稀疏表示,这个表示尽可能保留了手势类别的信息,同时最小化了与签名者身份相关的干扰。 使用支持向量机(SVM)作为分类器,研究者将这些片段的级联稀疏编码特征用于识别。实验结果表明,该方法在独立于签名者的手势识别中表现出优越性能,优于其他现有的基准方法。此外,即使在依赖签名者特征的情况下,该方法仍然能够提供良好的识别效果,显示出其在各种场景下的适应性。 这项研究为手语识别领域提供了一个创新的解决方案,通过语义约束的词典学习,提高了识别的鲁棒性和泛化能力,这对于提高手语交流的效率和无障碍性具有重要意义。