深度多任务学习:微妙表情识别与心理状态分析

0 下载量 133 浏览量 更新于2024-06-20 收藏 1.15MB PDF 举报
深度多任务学习识别心理状态及微妙的表情识别是当前计算机视觉领域的前沿研究。该研究由胡国胜等人主导,关注于解决一个关键但被忽视的问题——如何有效地识别人们微妙的表情,这些表情包含了丰富的心理活动信息,如情绪识别中的细微差别,对于欺骗检测等领域具有重要意义。 传统的面部表情识别往往集中在基本情绪如愤怒、恐惧、快乐、悲伤等,但研究人员开始探索更深层次的心理状态识别,如焦虑、傲慢、犹豫和怀疑等。他们提出了一种创新的多任务学习(MTL)方法,通过结合一个副任务——面部标志检测,利用卷积神经网络(CNN)进行微妙表情识别。以往的MTL方法通常依赖于预先设定的共享和任务特定层,但这种方法存在局限性,因为如何确定哪些层应共享并未有明确准则。 为此,研究人员设计了一种新颖的MTL框架,采用tensor迹范数正则化进行自动学习,以智能地决定哪些网络层应该共享。这种方法有助于克服共享层选择的随机性,使得模型能够更好地适应不同任务的需求。同时,他们提出了不变表示学习,使CNN能够在不重叠的数据集之间迁移,减少了对数据分布的一致性的依赖,提高了模型的泛化能力。 为推动微妙表情识别的发展,研究团队创建了一个大规模的野外数据库——LSEMSW(微妙情绪和精神状态数据库),包含超过176,000张图像,标注了13种情绪,这是目前最大的微妙表情数据集,可供深度CNN进行训练。通过与300-W(地标)等数据库的实验验证,他们的方法显示出显著的效果。 此外,研究还探讨了如何将从LSEMSW中学到的知识迁移到非微妙表情识别,即传统的面部表情识别任务。他们通过迁移学习在Oulu-Casia NIRVis和CK+数据库上实现了极具竞争力的结果,这证明了他们在微妙表情识别上的研究成果对通用表情识别也有积极的推动作用。 总结来说,这项研究通过深度多任务学习和定制化的MTL框架,以及大规模的LSEMSW数据集,不仅提升了微妙表情识别的性能,还展示了如何跨领域应用所学到的知识,推动了计算机视觉技术在理解人类复杂情绪和心理状态方面的进步。