深度学习驱动的人脸动作单元检测新算法

3 下载量 41 浏览量 更新于2024-09-03 收藏 817KB PDF 举报
"基于深度学习的人脸动作单元检测算法,黄环,张洪刚,本文提出了一种新的人脸动作单元检测算法,对现有的网络结构进行改进。首先用中心裁剪方式代替随机裁剪将对齐后的人脸图片进行预处理,提高图片整体位置的稳定性;然后提出移去原网络中的区域卷积层,直接对全脸进行卷积并保留残差结构的方案,使网络更好地捕捉整脸信息及各动作单元(Action Unit,简称AU)之间的关联性;最后提出用残差结构的小卷积核代替高层的大卷积核的方法,增加网络深度,更充分地提取高维信息。最终,人脸动作单元检测算法的F1值提高11.6%。" 这篇论文"基于深度学习的人脸动作单元检测算法"由黄环和张洪刚撰写,其核心是提出一种创新的深度学习方法来提升人脸动作单元(AU)检测的性能。人脸动作单元是面部表情分析中的基本元素,它们代表了面部肌肉的微小运动,能够反映人的情绪和意图。 论文首先针对预处理阶段进行优化,采用中心裁剪代替随机裁剪的方式,以增强对齐后人脸图片的位置稳定性。这种方法可以减少因随机裁剪导致的图像关键部分丢失,从而更准确地捕捉人脸特征。 其次,研究者建议去除原有的网络中的区域卷积层,改而直接对整个脸部进行卷积操作。这种改变有助于网络更好地理解脸部的整体信息,同时保持残差结构,这使得网络在识别不同AU之间的相互关系时更为高效。残差结构在深度学习中常用于解决梯度消失问题,使得网络可以学习到更深层次的特征。 最后,他们提出使用小卷积核的残差结构来替代高层网络中的大卷积核。小卷积核能提供更高的分辨率,更精细地捕捉细节,增加了网络的深度,有利于提取更复杂的高维信息,进一步提升AU检测的精度。 实验结果表明,通过这些改进,该算法的F1值提升了11.6%,显示出显著的性能提升。这为深度学习在人脸识别和情感分析领域的应用提供了新的思路和实践依据。论文作者的研究方向包括计算机视觉、数字图像处理和智能交通,他们的工作对于推动相关领域的发展具有重要意义。