基于多尺度与矩描绘子的单目视觉手势识别算法:93.5%识别率

需积分: 5 0 下载量 110 浏览量 更新于2024-08-12 收藏 434KB PDF 举报
本文主要探讨了一种创新的多尺度模型与矩描绘子相结合的手势识别算法,发表于2004年的自然科学论文领域,由丁海洋和阮秋琦两位作者来自北京交通大学计算机与信息技术学院。该研究专注于单目视觉下的手势识别技术,其核心思想是通过用户初始化获取基础识别参数,并利用视频跟踪实时捕获用户的动作区域。 在特征提取阶段,算法采用了矩描绘子和多尺度模型相结合的方法。矩描绘子是一种简单而有效的形状描述符,它基于图像区域的矩来捕捉对象的几何特性,如位置、大小和旋转。多尺度模型则允许算法在不同的尺度上分析对象,以应对不同大小或角度的手势变化,增强了对复杂手势的识别能力。 作者首先通过用户初始化过程确定关键参数,这可能包括手势的基准位置、大小范围以及可能的姿势变化。然后,通过视频跟踪技术跟踪用户的运动,确保始终关注手部的动作区域。在该区域中,矩描绘子与多尺度模型协同工作,提取出有助于区分不同手势的关键特征。 识别过程中,这些特征被输入到分类识别规则中,可能是基于机器学习的方法,如支持向量机(SVM)或神经网络,对每个特征向量进行分类,判断其对应的特定手势。实验结果显示,该算法展现出良好的泛化性能,能够在不同用户之间实现稳定且准确的手势识别,其识别率达到了令人满意的93.5%。 该研究的重要性在于,它不仅提高了手势识别的精度,还降低了对手势识别硬件设备的要求,仅需一个摄像头就能实现,这对于便携式和低成本的交互系统设计具有重要意义。同时,结合了矩描绘子和多尺度模型的手法也为后续的计算机视觉和模式识别领域的研究提供了有价值的参考方法。