课堂学生表情识别:自注意力机制与特征融合模型

需积分: 0 2 下载量 74 浏览量 更新于2024-08-03 收藏 886KB PDF 举报
"这篇论文提出了一种基于自注意力机制与特征融合的课堂学生表情识别模型,旨在解决在复杂课堂环境中由于遮挡导致的学生人脸表情识别准确性下降的问题。通过部分分割和随机遮挡策略,将原始图像分割成多路人脸图像,并使用残差网络提取特征。然后,利用自注意力机制为每一路网络分配不同的权重,特别是强调眼部特征的重要性,以限制遮挡支路的权重低于眼部支路。最终,通过特征融合形成全局特征,提高整体识别性能。在FERplus公开数据集上的实验结果显示,该模型能显著提升表情识别的准确率,有效缓解遮挡造成的信息损失。关键词包括特征融合、自注意力机制以及人脸表情识别。" 本文介绍的研究工作集中在课堂学生表情识别这一领域,针对课堂环境中常见的遮挡问题,如学生的头发、眼镜或手部可能遮挡面部,提出了一种创新的解决方案。首先,作者采取了部分分割技术,将原始图像分解成多个独立的人脸图像,这些图像可能会包含不同程度的遮挡。接着,使用残差网络(Residual Network)来提取每一路径中的特征,残差网络因其在深度学习中的出色表现,尤其是在图像识别任务中的能力而被广泛应用。 为了处理遮挡问题并赋予关键区域(如眼睛)更高的关注度,论文引入了自注意力机制(Self-Attention Mechanism)。自注意力机制允许模型根据图像各部分的重要性和上下文关系动态分配权重,从而更准确地捕捉到表情的关键信息。特别地,通过约束损失函数,确保了在遮挡路径上的权重小于眼部特征的权重,这有助于模型更加重视那些非遮挡的部分,特别是对于表情识别至关重要的眼睛区域。 接下来,论文采用了特征融合策略,将来自不同路径的特征结合在一起,形成一个全局的特征表示。这种融合方式可以综合各个路径的信息,提高模型对复杂遮挡条件下的表情识别能力。实验部分,研究者在公开的FERplus数据集上验证了模型的有效性,结果显示,所提出的模型在准确率上有了显著提升,验证了其在实际课堂环境中的潜力。 这篇论文为解决课堂环境中的人脸表情识别问题提供了一个新的视角,通过自注意力机制和特征融合,提高了模型对遮挡情况的鲁棒性,为未来在类似复杂场景下的表情识别研究提供了有价值的参考。