深度学习与多信息融合:一种高效的人脸表情识别算法

需积分: 9 5 下载量 63 浏览量 更新于2024-08-13 收藏 1.5MB PDF 举报
"本文主要探讨了一种基于多信息融合的深度学习人脸表情识别算法,该算法在传统卷积神经网络的基础上,结合人脸图像、表情变化的标记点坐标以及稀疏自编码器,旨在提高表情识别的准确性和效率。" 在计算机科学和人工智能领域,人脸表情识别是一种重要的技术,它涉及到计算机视觉、图像处理、机器学习和模式识别等多个子领域。人脸表情是人类情感表达的主要方式之一,占人际交流信息传递的大部分比例。因此,理解和解析人脸表情对于构建更加自然和智能的人机交互系统至关重要。 传统的表情识别方法通常依赖于单一的信息源,如单一的人脸图像或特定的人脸特征点。然而,这种方法可能无法充分捕捉到人脸表情的全貌,特别是在复杂或微妙的情绪表达中。针对这一问题,该研究提出了一个创新的三通道多信息融合的深度学习模型。这个模型的输入包括人脸图像、从平静到表情高峰时期的标记点坐标的相对位移,这样可以全面考虑表情变化过程中的全局信息。 深度学习在此模型中扮演了核心角色,它利用深度神经网络(尤其是卷积神经网络CNN)来自动学习和提取人脸图像的特征。然而,仅凭CNN可能无法有效地捕捉边缘特征,因此,研究者引入了稀疏自编码器来增强边缘特征的提取能力,这有助于提高模型对微小表情变化的敏感度。 实验是在标准的CK+数据集上进行的,结果显示,与现有同类算法相比,该多信息融合的深度学习模型在表情识别的准确性上有显著提升。这证明了该模型的有效性,为未来的人脸表情识别研究和实际应用提供了新的思路和技术支持。 关键词:表情识别、深度学习、稀疏自编码器、多信息融合 该研究工作发表在《计算机工程与应用》杂志上,文献标识码为A,中图分类号为TP391,doi号为10.3778/j.issn.1002-8331.1802-0128,作者为阮凯和邱卫根。