改进AlexNet提升人脸识别准确性:多尺度卷积与特征融合

4星 · 超过85%的资源 17 下载量 8 浏览量 更新于2024-08-28 4 收藏 4.26MB PDF 举报
本篇文章主要探讨了基于改进AlexNet的人脸表情识别技术,针对人脸表情识别中存在的问题,如受姿势、遮挡、光照变化及个体差异等因素影响的准确性问题,以及AlexNet原始模型在处理小尺寸表情图像时的局限性。文章提出了一种创新的算法,通过在AlexNet网络中引入多尺度卷积层,以适应表情图像的多样性,能够捕捉到不同尺度的特征信息。这种设计允许网络在不同层次之间进行跨连接特征融合,提高了特征的表达能力,有助于更全面地反映图像内容。 然而,过多的跨连接会导致参数数量剧增,可能引发训练难度增加和过拟合问题。为了缓解这个问题,作者采用了全局平均池化技术,对低层次特征进行降维,有效地减少了参数数量,同时避免了过度拟合的现象。这种优化策略使得模型能够在保持高效性能的同时,提升了泛化能力。 实验结果表明,经过改进的AlexNet在两个常用的人脸表情数据库——CK+和JAFFE上取得了显著的识别精度提升,分别达到了94.25%和93.02%,这证明了该方法的有效性和实用性。本文研究在人脸表情识别领域提供了有价值的技术改进,对于提高基于深度学习的面部表情识别系统的性能具有重要意义。关键词包括图像处理、图像分类、表情识别、AlexNet、特征提取、多尺度卷积、跨连接、全局平均池化和特征融合等,这些都展示了研究的核心技术和成果。