实时微表情识别:空洞卷积CNN提升准确性与速度

17 下载量 176 浏览量 更新于2024-08-31 5 收藏 857KB PDF 举报
本文主要探讨了一种结合空洞卷积的卷积神经网络 (CNN) 实时微表情识别算法。随着深度学习在人脸识别领域的广泛应用,尤其是对于微表情这种微妙情绪表达的识别,传统的特征提取方法已无法满足实时性的需求。微表情通常持续时间短,动作幅度小,这使得在多层卷积过程中容易丢失重要的细节信息。因此,研究人员提出了一种创新方法,即在CNN架构中引入空洞卷积核,这种技术允许在网络中保留更多的空间信息,避免了细节信息的丢失。 空洞卷积通过在滤波器中心移除一部分像素,保持周围像素不变,从而保持更大的感受野,有助于捕捉到更大范围的上下文信息。同时,为了应对实际应用中人脸姿态和大小的变化,文章还包含了人脸自动校正算法,提高了模型对人脸位置和形状变化的鲁棒性。这一结合了空洞卷积和人脸校正的CNN模型,是在CASME和CASMEⅡ两个微表情公开数据集上进行训练和测试的。 实验结果显示,该算法在CASME数据集上的准确率达到70.16%,在CASMEⅡ数据集上的准确率则达到72.26%,表明其在识别精度上有了显著提升。更为重要的是,模型能够保持实时性能,实现实时帧率高达60fps,满足了实际应用中的高效性需求。这证明了该方法在提高微表情识别准确率的同时,兼顾了实时性,并具备良好的鲁棒性和泛化能力。 这项研究为微表情识别领域提供了一个有效的解决方案,通过空洞卷积和人脸校正技术,改进了传统CNN在处理微表情这种高精度任务时的表现,有望在诸如情绪分析、人机交互等应用场景中发挥重要作用。同时,本文的研究也遵循了严格的学术规范,确保了论文的原创性和严谨性。