基于深度学习的人脸表情识别:改进DBN与堆叠自编码器的应用

需积分: 50 9 下载量 16 浏览量 更新于2024-08-07 收藏 3.17MB PDF 举报
"这篇硕士论文探讨了基于深度学习的人脸表情识别算法,主要结合改进的深度信念网络(GB-DBN)和堆叠自编码器(SAE)进行特征提取和分类。研究流程包括人脸图像预处理、LBP特征提取、深度学习模型训练以及最终的表情识别。" 在人工智能领域,人脸表情识别是一项关键的技术,它涉及到计算机视觉、模式识别和生物特征识别等多个方面。论文详细介绍了整个实验流程,分为五个主要步骤: 1. **人脸表情图像预处理**:首先,对获取的人脸表情图像进行预处理,这通常包括使用滑动窗口定位人脸,然后对图像采样以降低维度,同时对切割好的图像块进行归一化,以确保所有数据在同一尺度上,利于后续处理。 2. **LBP特征提取**:局部二值模式(LBP)是一种有效的纹理描述符,能捕捉图像的局部特性。论文中提到,LBP被用于每一小块图像的特征提取,而非整张图像,这样可以保证不丢失任何重要特征。 3. **深度信念网络训练**:改进的深度信念网络(GB-DBN)在此过程中用于对LBP提取的特征进行预训练和微调,以获取更优的特征表示。DBN是一种无监督学习方法,能够从原始数据中学习多层次的抽象特征。 4. **堆叠自编码器分类**:堆叠自编码器(SAE)进一步对特征进行分类。自编码器是一种神经网络结构,用于学习数据的高效压缩表示,通过解码过程重构输入,SAE则是多个自编码器的堆叠,增强了特征学习能力。 5. **表情识别结果**:最后,经过SAE分类器的处理,得到的表情特征被用来做出最终的分类决策,实现人脸表情识别。 论文作者黄寿喜在广东工业大学攻读工程硕士,其研究结合了深度学习的两种重要模型——DBN和SAE,以提高人脸表情识别的准确性和效率。这种方法在解决传统方法中特征表达不佳的问题上展现出了潜力。论文还回顾了深度学习中的其他算法,如自动编码器、深度信念网络和深度卷积网络,展示了深度学习在人脸识别领域的广泛应用。