多特征融合卷积神经网络在人脸识别中的应用

需积分: 27 11 下载量 47 浏览量 更新于2024-09-03 收藏 808KB PDF 举报
"该文提出了一种基于多特征融合卷积神经网络的人脸表情识别方法,通过Inception结构增加网络的宽度和深度,提取多样性的特征,并将高层和低层特征融合,利用池化层的特征,进一步在全连接层进行特征融合处理,提高非线性表达能力,从而提升识别率。这种方法在FER2013和CK+数据集上的实验结果显示,识别率分别提高了0.06%和2.25%。" 本文主要探讨了人脸识别领域中的一个重要课题——基于多特征融合的卷积神经网络(CNN)在人脸表情识别中的应用。卷积神经网络由于其在图像处理领域的出色表现,被广泛用于特征提取和分类任务,但其存在的问题是特征提取可能不充分,且识别率有待提高。 文章首先指出了CNN在特征提取上的局限性,为解决这个问题,作者引入了Inception结构。Inception模块是Google在Inception网络(又称GoogLeNet)中提出的一种设计,它通过并行的不同尺寸的卷积层,以及最大池化层,增加了网络的宽度和深度,从而能够捕获不同尺度和方向的特征,提高了特征的多样性。 接下来,作者提出了特征融合策略。他们将通过Inception结构提取到的高层(抽象)特征与低层(细节)特征进行融合,这种融合旨在结合局部和全局的信息,以增强模型的理解能力。同时,利用池化层的特征,可以捕获图像的空间信息,进一步提升了特征的表达能力。 特征融合后的结果送入全连接层,全连接层的作用是将特征映射到分类空间,通过对特征的线性和非线性转换,增强了网络的非线性表达能力,使得网络能够学习到更加丰富的特征表示。 最后,输出层通过Softmax分类器对表情进行分类。Softmax函数将每个类别的得分归一化,形成一个概率分布,便于模型做出决策。在FER2013和CK+这两个公开的人脸表情数据集上,实验验证了该方法的有效性,识别率分别有0.06%和2.25%的提升。 关键词涵盖了计算机图像处理、面部表情识别、卷积神经网络、特征融合、特征提取和表情分类,这些关键词揭示了研究的核心内容和技术手段。文章的研究成果对于理解和优化卷积神经网络在人脸表情识别中的应用具有一定的参考价值,特别是在网络设置和参数配置方面提供了实践指导。