双通道CNN提升静态手势识别精度与泛化能力

需积分: 17 3 下载量 2 浏览量 更新于2024-09-05 收藏 944KB PDF 举报
本文主要探讨了双通道卷积神经网络在静态手势识别中的应用,针对传统方法存在的问题进行改进。在计算机视觉领域,随着人机交互技术(HRI)的发展,特别是手势作为自然交互方式的应用需求增加,静态手势识别的重要性日益凸显。传统手势识别方法如基于隐马尔科夫模型(HMM)和集合特征的识别,虽然有一定应用,但其依赖于人工特征提取,这不仅耗时耗力,且对专业人员的知识和经验要求高,同时在面对复杂环境和陌生场景时识别能力有限。 作者提出了一种新的模型——双通道卷积神经网络(Double-Channel Convolutional Neural Network, DCCNN),旨在解决这些问题。DCCNN设计了两个相互独立的通道,每个通道采用不同尺度的卷积核,分别负责捕捉输入图像中不同尺度的特征。这种设计允许网络在局部细节和整体结构之间取得平衡,从而提高特征的丰富性和表达能力。在全连接层,两通道的特征被融合,增强模型的泛化性能。 实验是在Thomas Moeslund和Jochen Triesch手势数据库上进行的,结果显示,与传统方法相比,DCCNN显著提高了静态手势识别的准确率,不仅在识别精度上有所提升,而且在处理速度和环境适应性方面也有所增强。这表明,双通道卷积神经网络对于简化特征提取过程、降低对手势识别算法复杂性的贡献,以及提升系统在实际应用中的性能是显而易见的。 本文的研究为静态手势识别提供了一种创新且有效的解决方案,展示了深度学习技术在计算机视觉领域的实际应用潜力,预示着未来在人机交互和智能设备中的广泛应用前景。