提升静态手势识别效率:BOF-Gist特征算法研究

需积分: 10 1 下载量 67 浏览量 更新于2024-09-11 收藏 1.24MB PDF 举报
“本文提出了一种基于Bag of Visual Words (BOF) 和Gist特征的手势识别算法,旨在解决传统静态手势识别算法中存在的特征计算复杂度高、实时性差的问题。通过结合BOF和Gist特征,该算法能够在保持识别准确性的基础上提高实时性能。” 手势识别是人机交互中的一个重要研究领域,具有直观、生动的特点。随着计算机视觉技术的发展,静态手势识别已经成为一个热门的研究课题。然而,如何提取出高效、稳定且具有区分性的手势特征,以提高识别准确性和实时性,一直是一个挑战。 传统的手势识别方法,如基于边缘特征、空间分布特征、切线距离、SIFT特征或Hu不变矩等,各有优缺点。例如,边缘特征计算简单但易受光照变化影响,空间分布和切线距离特征对图像变换有不变性但计算复杂度高,SIFT特征描述细致但实时性不足,Hu不变矩则在遮挡和类似手势情况下识别率会下降。 本文提出的新方法引入了BOF-Gist特征。BOF是一种将图像表示为视觉词袋的概念,它通过将图像区域映射到一个预定义的视觉词汇库来降低特征维度,从而减少计算复杂度。Gist特征则能捕捉图像的整体场景信息,对手势的全局特征有很好的描述能力。将两者结合,既能保留Gist特征的全局信息优势,又能利用BOF的局部特征表达,有效降低了特征维度,提高了识别的实时性。 实验结果表明,该算法在标准数据库上对于简单背景下的10种手语手势识别正确率达到了90.42%,复杂背景下的识别正确率为79.05%,证明了其在保持高识别率的同时,具备良好的实时性能。这种方法对于解决静态手势识别中的实时性问题提供了一种新的思路,具有广阔的应用前景。 基于BOF-Gist特征的手势识别算法是一种创新的尝试,它通过优化特征表示,成功地平衡了识别准确性和计算效率,为未来的人机交互和智能系统设计提供了有价值的参考。