改进的单演中心对称LTP表情识别算法

需积分: 9 0 下载量 42 浏览量 更新于2024-09-02 收藏 1.62MB PDF 举报
"本文提出了一种改进的基于表情子区域单演中心对称局部三值编码的表情识别算法,通过提取单演特征并采用改进的中心对称动态阈值三值编码来增强特征表示能力,提高了人脸识别的准确性和鲁棒性。这种方法在JAFER和CK+数据库上进行了验证,表现出了优越的性能。" 在人脸表情识别领域,传统的特征提取方法往往在处理复杂的环境变化(如光照变化、噪声干扰)时表现出不足。为了改善这一问题,该研究提出了一种改进的单演中心对称局部三值编码(Monogenic Center-Symmetric Local Ternary Pattern, MCLTP)表情识别算法。单演信号理论是一种多维信号处理方法,它能够同时提供振幅、相位和方向信息,这对于理解和分析人脸表情的细微变化至关重要。 首先,算法通过分析人脸图像的表情子区域来提取单演特征。这些子区域通常是根据面部肌肉运动的关键区域来选择的,如眼睛、眉毛、嘴巴等,以捕捉到不同表情的独特模式。单演特征包含了人脸表情的振幅、相位和方向信息,这些信息是识别不同表情的基础。 接着,研究人员对提取出的单演特征进行量化编码,尤其是单演振幅特征。这里采用了一种改进的中心对称动态阈值三值编码方法。传统的中心对称局部三值编码(Local Ternary Pattern, LTP)通过比较像素与其周围像素的相对强度来创建二进制或三进制代码,但动态阈值的引入使得编码过程更加灵活,能适应不同光照条件下的图像,从而增强了特征的区分度。 然后,利用单演中心对称局部三值模式特征的直方图作为输入,结合最近邻分类器进行表情分类。最近邻分类器是一种基于实例的学习方法,它根据测试样本与训练样本之间的距离来判断其所属类别,这里的距离通常基于特征向量的欧氏距离。 实验结果在两个标准人脸表情数据库——JAFER和CK+上进行验证,显示了改进算法相对于传统方法在特征解析能力和识别率上的显著提升。在光照变化和噪声干扰等复杂环境下,该算法仍能保持较高的识别准确性和鲁棒性。 总结来说,这种改进的单演中心对称LTP表情识别算法通过创新的特征提取和编码方法,提高了表情识别的性能,并增强了算法在实际应用中的适应性。这种方法对于未来的人脸识别和情感计算研究提供了新的思路和技术支持。