四元数+CNN:高效表情识别新方法

需积分: 10 1 下载量 83 浏览量 更新于2024-09-02 收藏 2.48MB PDF 举报
本文档《基于四元数局部编码和卷积网络的表情识别.pdf》主要探讨了一种创新的人脸表情识别方法,针对彩色图像中的颜色信息和通道间关联性的高效利用。研究者提出了一种结合四元数矩阵相位信息和幅值信息的特征提取策略,通过Clifford平移操作处理彩色表情图像,将其转换为纯四元数矩阵。这种方法进一步采用了局部二值模式(Local Binary Patterns, LBP)对相位和幅值分别进行编码,以便提取多尺度融合的图像特征。 LBP是一种简单而有效的纹理描述符,它通过比较像素与其周围邻域的灰度值来编码图像局部信息,具有良好的不变性和鲁棒性。在本文中,这种编码被用来增强表情图像的特征表达能力,捕捉到更丰富的细节信息。 然后,这些特征被输入到卷积神经网络(Convolutional Neural Networks, CNN)中进行训练和分类。CNN作为一种深度学习模型,特别适合处理图像数据,其卷积层能够自动学习和提取特征,全连接层则用于分类任务。这种方法的优势在于能够适应复杂的数据结构,并通过端到端的学习优化整个识别过程。 实验结果在两个常用的表情识别数据库上进行了验证,分别是RAF-DB和MMI表情库。结果显示,该算法在RAF-DB上的识别率达到79.42%,在MMI表情库上达到93.28%,显示出显著的识别性能和稳定性,相较于其他表情识别算法具有更高的准确度。 研究者还提到了该项目得到了国家自然科学基金、北京市属高校高水平教师队伍建设支持计划基金、北京市优秀人才基金以及北京市教委科研计划基金等项目的资助,这表明该研究得到了多方面的支持和认可。 总结来说,这篇文章的核心贡献是提出了一种新颖的四元数局部编码与卷积神经网络结合的情感识别方法,提高了人脸识别的准确性和鲁棒性,展示了在表情识别领域的应用潜力。