使用生成对抗网络增强人脸表情识别数据

下载需积分: 49 | PDF格式 | 1.6MB | 更新于2024-09-03 | 42 浏览量 | 举报

"本文提出了一种基于生成对抗网络(GAN)的人脸表情数据增强方法，旨在解决人脸表情识别中数据量不足和数据不平衡的问题。通过改进的StarGAN模型，实现多风格人脸表情图像转换，从一种表情转换为同一人的其他表情，从而增加数据集的多样性和容量。实验表明，这种方法能够提升人脸表情识别模型的识别率和泛化性能，并有助于缓解数据不平衡的影响。" 基于生成对抗网络(GAN)的人脸表情数据增强方法是针对当前人脸表情识别领域存在的问题，如数据集规模小和数据分布不均等，而提出的一种解决方案。GAN是一种深度学习框架，由生成器和判别器两部分构成，它们在训练过程中相互竞争，生成器尝试伪造真实的数据，而判别器则试图区分真实数据和生成数据。在人脸表情识别中，生成器被用来从特定表情的面部图像生成同一人其他表情的图像，从而实现数据集的扩展。传统的人脸表情识别通常包括图像预处理、特征提取和表情分类三个步骤。预处理可能涉及去除背景噪声、标准化面部特征等；特征提取可以基于纹理、几何或深度学习方法；表情分类则利用提取的特征进行识别。近年来，深度学习技术的进步，特别是卷积神经网络(CNN)，在图像识别任务上展现出强大能力，使得基于深度学习的方法成为主流。然而，深度学习模型通常需要大量标注数据来训练，但现存的人脸表情数据库如CK+和JAFE等，其样本数量有限且分布不均衡。例如，RAF数据库中快乐表情的数量远大于恐惧，CK+中蔑视的表情序列也很少。这种不平衡可能导致模型在处理较少样本的表情时表现不佳。为了解决这些问题，文章提出的增强方法基于StarGAN，这是一种能够进行多域图像转换的GAN变体。通过调整重构误差，该方法能够更准确地在不同表情之间转换，生成具有高真实感的新图像。实验在CK+数据库上进行，结果显示，使用该数据增强方法训练的表情识别模型在识别率和泛化能力上有所提升，同时，这种方法对于处理数据不平衡问题也具有一定的实用性。该工作提供了一个有效的方法来扩充人脸表情数据集，增强了模型对各种表情的识别能力，对于改善基于深度学习的人脸表情识别系统性能具有积极意义。此外，这种方法的应用还可能拓展到其他领域，如面部识别、情感分析等，以应对类似的数据量和分布挑战。

2020，56（4）

1 引言

人脸表情是人们日常生活中最有效的交流方式之

一，通常将它定义为面部肌肉对内在情绪状态所产生的

一个或多个运动和变化。自 20 世纪 90 年代以来，许多

人员致力于该领域的研究

[1]

。

人脸表情识别包含三部分：图像预处理、特征提取

和表情分类。根据特征提取的方法，可以分为基于纹理

特征的方法

[2]

、基于几何特征的方法

[3]

和基于深度神经

网络的方法

[4-5]

。近几年，飞速发展的深度学习技术和规

模越来越大的数据集使得基于深度神经网络的方法在

图像识别领域更加重要。

深度神经网络离不开大规模数据，然而对于人脸表

情数据集来说，标准人脸表情数据库 CK+仅有 327 个标

注的视频序列

[6]

，更早的数据库 JAFFE 仅有 213 张面部

表情图片

[7]

。人脸表情数据库还有一个普遍的问题：数

据量不平衡。RAF 数据库中快乐标签下的数据量是恐

惧的 17 倍；CK+数据库仅有 18 个蔑视的序列。因此，需

要一种图像生成技术，在扩充数据集的同时解决数据量

基于生成对抗网络的人脸表情数据增强方法

孙晓

1，2

，丁小龙

1，2

1. 合肥工业大学情感计算与系统结构研究所，合肥 230601

2. 合肥工业大学计算机与信息学院，合肥 230601

摘要：基于深度学习的方法已经在人脸表情识别中取得了重大进展，然而人脸表情数据库的规模普遍不大。为了

解决数据量不足的问题，提出了一种静态图像数据增强方法。在 StarGAN 的基础上修改重构误差实现多风格人脸

表情图像转换，利用生成器由某一表情下的面部图像生成同一人其他表情的面部图像。在 CK+表情库上的实验表

明，该方法有利于提高人脸表情识别模型的识别率和泛化能力，同时对解决数据量不平衡的问题也有借鉴作用。

关键词：数据增强；生成对抗网络；人脸表情识别；深度学习

文献标志码：A 中图分类号：TP391 doi：10.3778/j.issn.1002-8331.1904-0309

孙晓，丁小龙 . 基于生成对抗网络的人脸表情数据增强方法 .计算机工程与应用，2020，56（4）：115-121.

SU N Xiao, DING Xiao long. Data augme ntat ion method based on genera tive adversarial networks for facial expression

recogn ition sets. Computer Engineering and Applications, 2020, 56（4）：115-121.

Data Augmentation Meth od Based on Generative Adversar ial Networks for Facial Expression

Recogni tion Sets

SUN Xiao

1，2

, DING Xiaolong

1，2

1.Institute of Em otional Computing and System Architecture, Hefei University of Technology, Hefei 230601, China

2.School of Computer Science and Information Engineering, Hefei University of Technology, Hefei 23060 1, China

Ab stract：Deep learning method s have signi ficantly advanced in facial expression rec ognition. But, facial ex pression

databases usually do not have enough data . To so lve this problem, this paper pr oposes a static image data augmentatio n

method. A multi-domain imag e-to-image translation mod el based on StarGAN is i mplemented b y mo difying the recon-

struction loss, w hich can generate m ulti- expression facial image s from the one of a certain exp ression. Experiments on

CK+ expression database show that this method can improve the accuracy and generalization capacity of recognition models,

and can be used for reference to solve the problem of data imbalance.

Key words：data augmentat ion; generative adversarial networks; facial expression recogni tion; deep lea rning

基金项目：国家 JW 科技创新特区项目（No.JD2017XATQ0026）。

作者简介：孙晓（1980—），男，博士，副教授，研究领域为自然语言处理、智能人机会话与交互、情感计算；丁小龙（1994—），通信作

者，男，硕士，研究领域为深度学习、人脸表情识别，E-mail：543677098@qq.com。

收稿日期：2019-04-18 修回日期：2019-06-05 文章编号：1002-8331（2020）04-0115-07

CN KI 网络出版：2019-07-05, http://kns.cnki.net/kcms /detail/11.2127.tp.20 190703. 1736.006.ht ml

Computer Engineering and Applications 计算机工程与应用

115

万方数据

下载后可阅读完整内容，剩余6页未读，立即下载

anitachiu_2

粉丝: 31

使用生成对抗网络增强人脸表情识别数据

生成对抗网络（GAN）代码+数据集

基于生成对抗网络的多属性人脸图像生成.pdf

基于深度学习的人脸表情特征分析.pdf

基于深度学习的人脸识别方法的探究.pdf

基于条件流的人脸正面化生成对抗模型.pdf

基于生成对抗网络的图像生成（51页）.pdf

基于深度卷积对抗神经网络的多状态自适应人脸识别方法.pdf

人脸表情识别综述.pdf

基于小波变换和非负矩阵分解的人脸识别改进方法.pdf

人脸表情识别算法研究.

最新资源