使用Kinect的中国手语识别方法

需积分: 27 0 下载量 93 浏览量 更新于2024-08-13 1 收藏 1.71MB PDF 举报
"基于Kinect的中国手语识别 (2013年) - 使用Kinect设备提取深度图像信息,通过3D坐标分析实现中国手语识别的论文" 这篇论文介绍了一种利用微软Kinect设备进行中国手语识别的新方法。在2013年的背景下,该研究针对中国手语的三个主要构成部分——手型、手的位置和手的方向,提出了一个综合的特征提取和识别系统。 首先,该方法依赖于Kinect传感器获取人体和手的三维坐标信息。Kinect通过深度感应技术能够实时捕捉到人体骨架的关键关节位置,这为识别手语提供了基础数据。 接下来,为了提取手的位置和方向特征,论文采用了DBSCAN(Density-Based Spatial Clustering of Applications with Noise)和K-means两种聚类算法。DBSCAN是一种无参数的聚类算法,能有效地处理噪声点并发现任意形状的集群,而K-means则适合处理球形簇的数据,两者结合可以更全面地捕捉手的位置变化。这些位置基元和方向基元是手语识别的重要组成部分。 对于复杂的手型特征,研究者提出了一种结合CLTree(Classifier and Learner Tree)和Attribute bagging的聚类集成方法。CLTree是一种决策树模型,能够处理类别不平衡问题,Attribute bagging则是一种特征集合策略,通过采样和构建多个分类器来提高整体性能。这种集成方法增强了手型特征的提取能力。 最后,论文采用模板匹配技术将上述三类基元(手型、位置、方向)组合起来,对识别的中国手语进行匹配。模板匹配是一种广泛应用于模式识别的方法,它通过比较输入样本与预定义模板之间的相似性来识别目标。 在实验阶段,研究人员选取了72个不同的中国手语进行测试,得到的平均识别率为90.35%。这一结果表明,该方法在实际应用中具有较高的准确性和可行性,为今后的手语识别研究和无障碍通信技术的发展提供了有益的参考。 关键词:中国手语识别、基元、聚类、Kinect 中图分类号:TP18 文献标识码:A 文章编号:1673-825X(2013)06-0834-08