深度学习与可靠众包:野生表情识别新方法

需积分: 9 0 下载量 198 浏览量 更新于2024-08-29 收藏 2.53MB PDF 举报
"可靠的众包与深度局部保持学习用于野生表情识别" 在计算机视觉领域,面部表情识别是一项重要的研究任务,特别是在人机交互、情绪分析和社会心理学应用中。然而,过去的面部表情研究通常依赖于相对有限的数据集,这使得对当前方法在实际场景中的有效性存在不确定性。论文"Reliable Crowdsourcing and Deep Locality-Preserving Learning for Expression Recognition in the Wild"由北京邮电大学的Shan Li、Weihong Deng和JunPing Du共同撰写,他们提出了一个创新的数据库RAF-DB,以及一种新的深度学习方法DLP-CNN(Deep Locality-Preserving Convolutional Neural Network)。 RAF-DB数据库包含大约30,000张来自数千个个体的面部图像,每个图像平均被独立标注了40次。利用EM(期望最大化)算法,他们有效地筛选出不可靠的标签,确保数据的准确性。通过众包的方式,研究发现现实生活中的面部表情往往表达复合情感,甚至混合情感,这是现有实验室控制环境下数据集所缺乏的特性。因此,RAF-DB是第一个包含自然环境中复合表情的数据库。 为了应对RAF-DB中基本情感动作单元的多样性及可能的偏离问题,研究者提出了DLP-CNN模型。该模型的目标是通过强化深度特征的判别能力来解决这一挑战。深度学习,尤其是卷积神经网络(CNN),已经在图像识别任务中展现出强大的性能。然而,在处理复杂和多变的情感表达时,传统的深度学习方法可能会遇到困难,因为它们可能过于关注全局特征而忽视了局部信息的保留。 DLP-CNN方法的核心在于结合了深度学习的全局模式捕获能力和局部特征的保持策略。它通过在CNN架构中引入局部保持正则化,使得网络在学习全局表示的同时,也能捕捉到面部表情的细微变化,从而提高对复合和混合情感的识别精度。这种方法有望改善现有模型在处理真实世界复杂情感表达时的性能,并推动面部表情识别技术的发展。 这篇论文的工作为表情识别研究提供了一个更为现实和多样化的数据集,同时提出了一种新的深度学习方法,以适应并优化处理这些数据。这不仅加深了我们对自然环境中面部表情的理解,也为未来的情绪分析系统设计提供了有价值的参考。