深度多任务学习：微妙表情识别与心理状态分析

133 浏览量更新于2024-06-20 收藏 1.15MB PDF 举报

深度多任务学习识别心理状态及微妙的表情识别是当前计算机视觉领域的前沿研究。该研究由胡国胜等人主导，关注于解决一个关键但被忽视的问题——如何有效地识别人们微妙的表情，这些表情包含了丰富的心理活动信息，如情绪识别中的细微差别，对于欺骗检测等领域具有重要意义。传统的面部表情识别往往集中在基本情绪如愤怒、恐惧、快乐、悲伤等，但研究人员开始探索更深层次的心理状态识别，如焦虑、傲慢、犹豫和怀疑等。他们提出了一种创新的多任务学习（MTL）方法，通过结合一个副任务——面部标志检测，利用卷积神经网络（CNN）进行微妙表情识别。以往的MTL方法通常依赖于预先设定的共享和任务特定层，但这种方法存在局限性，因为如何确定哪些层应共享并未有明确准则。为此，研究人员设计了一种新颖的MTL框架，采用tensor迹范数正则化进行自动学习，以智能地决定哪些网络层应该共享。这种方法有助于克服共享层选择的随机性，使得模型能够更好地适应不同任务的需求。同时，他们提出了不变表示学习，使CNN能够在不重叠的数据集之间迁移，减少了对数据分布的一致性的依赖，提高了模型的泛化能力。为推动微妙表情识别的发展，研究团队创建了一个大规模的野外数据库——LSEMSW（微妙情绪和精神状态数据库），包含超过176,000张图像，标注了13种情绪，这是目前最大的微妙表情数据集，可供深度CNN进行训练。通过与300-W（地标）等数据库的实验验证，他们的方法显示出显著的效果。此外，研究还探讨了如何将从LSEMSW中学到的知识迁移到非微妙表情识别，即传统的面部表情识别任务。他们通过迁移学习在Oulu-Casia NIRVis和CK+数据库上实现了极具竞争力的结果，这证明了他们在微妙表情识别上的研究成果对通用表情识别也有积极的推动作用。总结来说，这项研究通过深度多任务学习和定制化的MTL框架，以及大规模的LSEMSW数据集，不仅提升了微妙表情识别的性能，还展示了如何跨领域应用所学到的知识，推动了计算机视觉技术在理解人类复杂情绪和心理状态方面的进步。

G. Hu等人

这是一个人试图隐藏的[25]。这与处理微妙的线索有关，但不同之处

在于它通常在视频而不是图像上执行

（i）与标准启发式设计的深度MTL不同，我们提出了一种端到端

软共享策略，该策略通过优化迹范数正则化参数来灵活地学习在

哪里共享、共享什么以及共享多少我们进一步嵌入了一个分布对

齐方法，以便在每个任务的训练集不相交时保持良好的性能

(ii)我们贡献了我们的LSEMSW数据集，由176K图像组成，手动标注

了13种情绪和认知状态。这是第一个用于

细微

表情分析的数据库，第

一个用于从面部表情中识别

认知

状态的数据库我们将发布这个数据

库，以推进深度学习时代的精神状态识别。此外，源代码和经过训练

的模型将公开提供。(iii)我们表明，LSEMSW可以通过使用迁移学习

在Oulu-Casia NIR Vis [62] 和CK+ [29]数据库上实现非常有竞争力的

TNER性能，从而使传统（非微妙）表达识别（TNER）受益。

方法

2.1

预赛

基于矩阵的多任务学习基于矩阵的多任务学习通常建立在线性模

型上，即，每个任务由

维权重向量

来参数化，并且该模型是

，

其中

是

表示实例的D维权重向量。基于矩阵的MTL的目标

函数

（

）

（

一

）

（

一

）

（

一

）

可以写成

（

，

）

Ω

（

）

。

（

，

）

loss

实现

了一个可持续发展的目标

。

这是一

个很大

的问题

对于第

个任务，存在

（

）

个

训练实例。假设

每个

t的维数

为

的f

e at u e，则模型的w（i）为am的大小

。

（

）

的集合

形成

矩阵

，其中第i列是第i个任务的线性模型。利用正则化器

（

）来

鼓励

成为低秩矩阵。一些选择包括

，

范数[2]和迹范数[19]。基

于张量的多任务学习在标准MTL中，每个任务都由单个因子索

引。但在一些现实问题中，任务是由多个因素索引的所有任务的线

性模型的集合则是大小为

T2的3向张量W

，其中

和

是两个任务指

数。在这种情况下，使用了张量范数正则化

器

[51]。例如，所有矩

阵化的迹范数之和

[44]

和缩放的潜在迹范数[56]。然而，这样的先前

的基于张量范数的正则化器已经被限制到浅模型。我们开发

了允许

在深度网络中端到端应用张量范数的方法。

深度多任务学习随着深度学习的成功，许多研究已经研究了深度MTL

[28，61，41，36，58]。例如，在一个示例中，使用CNN找到面部标

志以及识别面部属性[61，41]。标准方法[28，61，41]是共享深度网络

的底层，并为底层使用特定于询问的

参数。

我们

称这种类型的

“pred

fined d的硬盘”硬盘为硬盘

。

这些数据库已

成为2000年代的

数

据库

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度多任务学习：微妙表情识别与心理状态分析

基于深度学习的面部表情识别研究

深度学习的表情识别

基于深度学习的表情识别系统

深度学习，行人重识别re-id，多任务学习.pptx

多信息融合的深度学习人脸表情识别算法研究.pdf

基于深度信念网络和多任务学习的人脸识别.pdf

Pytorch实现基于深度学习卷积神经网络的面部表情识别项目源码+面部表情数据集（人脸面部表情识别项目）

【人脸表情识别】深度学习卷积神经网络CNN人脸表情识别（含识别率 七种表情）【含Matlab源码 4316期】.zip

【人脸表情识别】 GUI深度学习卷积神经网络CNN人脸表情识别（含识别率 七种表情）【含Matlab源码 4316期】.zip

HyperFace：深度多任务人脸识别框架

最新资源

【人脸表情识别】深度学习卷积神经网络CNN人脸表情识别（含识别率七种表情）【含Matlab源码 4316期】.zip

【人脸表情识别】 GUI深度学习卷积神经网络CNN人脸表情识别（含识别率七种表情）【含Matlab源码 4316期】.zip