基于LBP和BOW融合的高效人脸表情识别方法

需积分: 9 2 下载量 199 浏览量 更新于2024-09-06 收藏 1.37MB PDF 举报
本文主要探讨了"基于特征融合的人脸表情识别研究"这一主题,针对传统人脸表情识别方法在实际应用中可能遇到的光照、噪声等环境因素导致识别准确率不高的问题,提出了一个新颖的解决方案。该方法首先从两个关键维度对表情信息进行深度描述,即纹理特征和语义特征。 纹理特征部分,作者采用了局部二值模式(Local Binary Pattern, LBP)算法。LBP是一种简单而有效的纹理描述符,它通过对图像局部区域像素的灰度差异进行编码,捕捉到人脸表情中的微小变化,有助于区分不同的情绪表达。这种特征提取方法能够有效地抵抗光照变化,因为它是基于像素邻域的相对特性。 另一方面,语义特征则是通过词袋模型(Bag of Words, BOW)来提取。词袋模型将图像视为一个“单词”(像素值或特征)的集合,而不考虑它们之间的顺序,这有助于捕捉表情的整体模式和特征分布。BOW方法强调的是图像中特定特征的出现频率,而非其位置,从而降低了噪声干扰的影响。 这两种特征提取方式独立工作后,接下来的关键步骤是进行特征融合。这里采用的是线性融合,即将LBP和BOW提取的特征视作多维向量,通过简单的加权或者求和的方式将其整合,以增强表情识别的鲁棒性和准确性。这种融合策略能够综合纹理和语义信息,提高识别系统的性能。 最后,文章利用支持向量机(Support Vector Machine, SVM)作为分类器。SVM是一种强大的监督学习算法,尤其适合处理小样本和非线性问题。通过构建最优决策边界,SVM能够在训练数据集中找到最佳的分类规则,从而对新的表情图像进行高效准确的识别。 实验结果部分,作者在JAFFE和CK+两个常用的人脸表情数据集上进行了测试。结果显示,这种方法在JAFFE数据集上的识别率达到98.76%,而在CK+数据集上的识别率也达到了97.58%,充分验证了所提方法的有效性和实用性。本文的工作提供了一种有效的人脸表情识别技术,对于提高人脸识别系统的稳定性和鲁棒性具有重要意义。