基于Gabor小波+PCA+LDA的HMM人脸表情识别提升策略

需积分: 36 95 下载量 185 浏览量 更新于2024-08-09 收藏 842KB PDF 举报
本文主要探讨了如何使用HMM(隐马尔可夫模型)进行人脸表情的训练和识别,特别是在数学建模和通用编程技术的应用。首先,文章将人脸表情分解为五个抽象的状态,每个状态对应额、眼、鼻、嘴和下巴等显著特征区域,这些区域按照自然顺序形成一个一维HMM过程。观察序列由这五个状态生成,但它们本身没有具体含义,需要通过观察数据来推断。 HMM人脸表情训练的关键在于为每种表情训练一个优化的模型。通过选择多幅同一种表情的人脸图像进行训练,总共需要构建7个HMM模型,一个模型对应一种表情。训练步骤包括以下几个环节: 1. 从人脸表情图像中选取特定尺寸的采样窗(如8×55像素),通过Gabor小波进行纹理特征提取,然后结合PCA(主成分分析)和LDA(线性判别分析)进一步降低维度,得到4维的特征列向量。这一步骤生成的观察序列用于后续的模型建立。 2. 建立HMM模型,包括设置状态数N(如5个状态)、状态转移概率矩阵A,以及初始参数如状态初始概率向量π和状态转移概率矩阵A的初始化。 3. 将训练数据分配到对应的状态向量中,以4维特征向量和5个状态的形式组织,然后设定模型参数。 结合混合高斯概率密度函数,将特征向量映射到HMM状态对应的高斯概率密度函数中,进行表情的识别分类。 作者李烈熊和苏两河针对人脸表情识别中的问题,提出了一种新的方法,即利用Gabor小波、PCA和LDA的联合特征提取技术,以增强对人脸表情特征的捕捉,尤其是纹理信息。这种方法相较于单纯使用Gabor小波或局部二值模式(LBP)等单一特征,能够提供更丰富的表情特征,从而提高识别精度。他们在JAFFE表情数据库上的实验结果显示,采用这种方法的HMM人脸表情识别系统,其整体识别率达到92.14%,这明显优于其他基于Gabor小波+LBP、组合距离或AAM模型等方法的识别率。 总结来说,本文的核心内容是通过数学建模和通用编程技术,结合Gabor小波、PCA和LDA特征提取,以及HMM模型,实现了一种高效且具有较好泛化能力的人脸表情识别系统,有效提高了人脸识别的准确性和效率。