深度学习驱动的面部动作单元识别：一种结构推理方法

53 浏览量更新于2024-06-20 收藏 1.16MB PDF 举报

"该文探讨了基于深层结构推理网络的人脸动作单元识别技术，旨在提升自动面部表情分析的准确性和效率。文中提到的深层结构推理网络结合了局部和全局特征学习，模仿图形模型推理方法进行类间信息传递，从而更好地识别和理解面部动作单元。在BP4D和DISFA数据集上的实验结果显示，这种方法相较于现有最佳性能提升了5.3%和8.2%。文章关键词包括计算机视觉、机器学习、深度学习、面部表情分析、面部动作单元以及结构推理。" 人脸动作单元识别是计算机视觉和人工智能领域的一个重要课题，涉及到对人类情感和意图的非语言性理解。FACS（面部动作单元系统）是这一领域的基础理论，它将面部表情分解为独立的、可识别的肌肉运动，即动作单元（AU）。每个AU对应一种特定的面部肌肉活动，如皱眉（AU1）、扬眉（AU2）等。传统的AU识别方法通常依赖于预定义的特征表示，但这些方法可能无法充分捕捉复杂的面部变化。随着深度学习的发展，尤其是卷积神经网络（CNN）的进步，研究人员开始利用深度学习来学习更丰富的局部特征，以提高AU识别的准确性。例如，ROI方法提取面部标志点附近的特征，而DRML和APL等非自适应方法则尝试全局信息的捕捉。然而，这些方法仍存在对非刚性形状变化的鲁棒性不足的问题。文章提出的深层结构推理网络（Deep Structured Reasoning Network, DSRN）旨在解决这些问题。DSRN在初期阶段学习局部和全局特征的结合，然后在后期通过类间消息传递算法模拟图形模型推理，增强特征之间的关联性。这种结构允许网络更好地理解和捕捉面部表情的复杂性，特别是在不同AU之间的相互作用方面。在实验部分，DSRN在两个公开的人脸表情数据库BP4D和DISFA上进行了验证，结果显示其性能显著优于现有的最佳方法。这表明，DSRN不仅能有效地学习和融合多尺度特征，还能通过增强的推理过程提高对AU识别的精确度，对实际应用如社会感知系统、电子学习和游戏设计等领域具有重大意义。这篇论文为深度学习在面部表情分析中的应用提供了新的视角，特别是在处理AU识别时如何结合局部和全局信息，以及如何利用类间关系进行更高效的推理。未来的研究可能会进一步探索DSRN与其他深度学习架构的集成，或者优化模型以适应更广泛的面部表情和跨文化差异。

深层结构推理网络

年

CNN

= 1

Ω

斑块

预测

融合

结构推理

图2：深度结构推理网络（DSIN）从全局和局部学习特征中学习独立的AU预

测。它通过考虑与其他

的相关性来每个输入图像被裁剪成一组面片

{

}

用于训练独立的CNN产生概率

对于

个AU

，

向量

（等式中

的

4）. 从

（特定AU的补丁预测），我们

学习用于产生单个AU预测fj的组合（等式110中的简化的

Ruppy

）

。4）.通过迭

代消息传递推断

之间的结构来计算最终预测

，该迭代消息传递类似于概

率图模型中的推断（

等式

中的4）.

如在CRF中，能量函数E（. ）通过一元和成对项计算为：

（

，

）=

（

，

π）+

（

，

）

∈E

（

，

φ）+

（

，

）

∈E

（

，

）

，

⑷

其中（. ）是一元项，ψ

（. ）是成对项，且Θ=π∪φ∪ω。图 2介绍了我们的深

度结构推理网络（DSIN）。它包括三

每个组件都被设计为求解方程中的项。 4. 我们将初始部分称为

斑块预测

（PP），其目的是从面部斑块详尽地学习深度局部表示并产生局部预测。其

次，

Fusion

(F)

模块执行每个

的补丁学习最后一个阶段，

结构推断

（

），通过捕获

之间的关系来细化AU预测。DSIN是端到端可训练的，CNN特征可以基于以多

任务学习方式从结构推理反向传播的梯度进行训练。

3.1

斑块预测

给定图像块

，一元

项

（

，

π）为每个块提供

置信度，其被定义为对数

概率：

（p

，

π）= log P（p|x

，

π）

。

（

5）

概率P（p|x

，

π）由独立的块预测函数建模

{Π i

（

I i;

π i

）

} P

剩余20页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习驱动的面部动作单元识别：一种结构推理方法

通过深层神经网络训练人脸图像

基于mtcnn和facenet的人脸识别

基于轻量级网络的实时人脸识别算法研究.pdf

基于paddlepaddle实现的人脸识别demo

facenet 人脸识别代码

基于YOLOv3的口罩识别.doc

基于残差SSD网络的OpenCV人脸检测模型发布

Lightfacenet：一种实时人脸识别的轻量级深度学习算法

卷积神经网络在人脸识别中的应用

揭秘OpenCV人脸识别算法：从原理到实战，打造高效人脸识别系统

最新资源