多摄像头手势识别系统G-Sense的设计与实现

5星 · 超过95%的资源 需积分: 16 13 下载量 165 浏览量 更新于2024-07-24 1 收藏 4.94MB PDF 举报
"基于多摄像头的手势识别研究与实现" 这篇硕士论文详细探讨了基于多摄像头的手势识别技术,旨在改进和优化现有的视觉手势识别系统。作者朱建伟在导师李文军的指导下,针对计算机软件与理论专业进行了深入的研究。 手势识别技术是一种自然的人机交互方式,它借助视觉计算技术,使得用户可以通过手势与机器进行沟通,从而弥补传统交互方式(如键盘、鼠标)的局限。尽管已有不少基于视觉的手势识别方法,但它们仍存在一些问题,如依赖经验设定的肤色阈值、无法有效处理手与脸部遮挡、对手掌与摄像头角度的限制以及在远距离识别时的精度问题。 论文提出了一套包含11种手势的小型手势词汇,这些手势结合了静态和动态元素,能够实现光标定位和命令发送等功能。在手势跟踪阶段,研究采用了YCrCb颜色空间,并建立了一种基于高斯分布的统计模型,通过自动初始化肤色参数和面积参数来适应不同的肤色环境。同时,论文提出了一种估算质心位置的方法,解决了手与脸部遮挡时的位置跟踪问题。 在手势识别部分,静态手势通过预定义规则进行识别,而动态手势则通过两个正交放置的摄像头捕捉不同视角的动作轨迹,利用离散型隐马尔可夫模型(HMM)建立模型进行三维运动轨迹的识别。实验数据集包含了11种手势的2200个动态手势视频,用于HMM的训练和测试。 论文的成果是设计并实现了一个名为G-Sense的手势识别系统,该系统使用两个普通摄像头,通过与Picasa照片浏览软件和拳击小游戏的互动来展示其功能和有效性。用户试用和反馈调查问卷进一步验证了系统的可用性和手势识别的准确性。 关键词涉及手势识别、多摄像头技术、肤色模型、手脸遮挡问题以及隐马尔可夫模型的应用,这些是该研究的核心技术和挑战。整体而言,这项工作为多摄像头手势识别提供了创新解决方案,提升了手势识别的准确性和用户体验。