SSD算法在人脸检测中的应用与优化

需积分: 45 106 浏览量更新于2024-09-03 3 收藏 1.47MB PDF 举报

"该资源是一篇关于基于SSD算法的人脸目标检测的研究论文，由杨璐和吴陈共同撰写，发表于2019年。文章探讨了如何使用SSD算法改进人脸检测，并通过添加负样本和应用正则化防止过拟合，以提升模型的精度和鲁棒性。实验在MXnet框架下进行，结果表明模型的mAp性能提升到0.997，并且在处理遮挡、光照和小目标时表现优秀。" 本文主要关注的是基于SSD（Single Shot MultiBox Detector）算法的人脸目标检测技术。SSD是一种用于目标检测的一体化深度学习算法，它能够在单次前向传播过程中预测出图像中的多个物体位置和类别，从而提高了检测效率。首先，为了优化SSD模型对人脸的检测，研究者使用了公开的人脸数据集FDDB（Fddb Faces）对网络模型进行再训练和改进。通过使用不同的人脸数据集，他们能够使模型更好地适应各种人脸的特征，从而提升检测效果。针对人脸检测过程中常见的过拟合问题，研究者采用了降噪自编码器（Denoising Autoencoder）方法。他们在输入数据集中添加负样本，即与人脸无关的图像，通过这种方式在训练模型时引入噪声，以增强模型的抗干扰能力。此外，他们利用L1正则化来创建一个稀疏模型。L1正则化鼓励模型权重尽可能地稀疏，这意味着大部分权重将接近于零，有助于减少过拟合，同时保持模型对高维特征的有效处理，增强了模型的泛化性能。这样，在网络的迭代训练过程中，可以有效地降低噪声并防止模型陷入过拟合状态。最后，研究人员应用了非极大值抑制（Non-Maximum Suppression，NMS）算法。NMS是目标检测中的关键步骤，用于从多个检测框中筛选出最有可能包含目标的那一个，从而确定最终的人脸检测窗口，有效地减少了冗余的检测结果。实验在MXnet深度学习框架下进行，结果显示，经过噪声处理的人脸检测模型的平均精度（mean average precision, mAp）提升到了0.997，这表明模型的检测性能得到了显著改善。同时，模型在面对遮挡、光照变化以及小目标等复杂情况时，仍然保持了较高的鲁棒性和快速的收敛速度。关键词包括：卷积神经网络（CNN）、SSD算法、NMS算法、正则化以及人脸检测，这些关键词反映了研究的主要内容和技术手段。这篇论文对于理解SSD算法在人脸检测中的应用，以及如何通过正则化和负样本训练来优化模型性能具有重要参考价值。

收稿日期:2018-12-03 修回日期:2019-04-04 网络出版时间:2019-06-26

基金项目:国家自然科学基金(61572242)

作者简介:杨璐(1994-),女,硕士研究生,研究方向为计算机视觉处理、深度学习；吴陈,博士,教授,硕导,研究方向为智能信息处理、模式

识别。

网络出版地址:http:/ / kns. cnki. net / kcms / detail / 61. 1450. TP. 20190627. 1720. 092. html

基于 SSD 算法的人脸目标检测的研究

杨璐,吴陈

(江苏科技大学计算机学院,江苏镇江 212003)

摘要:为实现 SSD 算法模型对人脸的目标检测,采用公开人脸数据集 FDDB 对网络模型进行重新训练改进。通过训练

时输入不同的人脸数据集来优化网络训练结果。针对人脸检测训练过程中的过拟合问题,通过降噪自编码器的方法,在

输入数据集中加入负样本,在训练模型中生成噪声。通过 L1 正则化产出稀疏模型,稀疏模型具有更好的特性去处理高维

的数据特征以增强模型的泛化能力,实现在网络迭代训练过程中降噪的效果,防止模型陷入过拟合。然后通过非极大值

抑制算法(NMS)使候选框确定为最终的人脸检测窗口进行人脸检测。在训练平台 MXnet 下的实验结果表明,加入噪声后

的人脸检测模型的 mAp(mean average precision)性能提高至 0. 997,同时在提高遮挡、光照、小目标等检测的鲁棒性的情况

下,仍保持较快的收敛速度。

关键词:卷积神经网络；SSD 算法；NMS 算法；正则化；人脸检测

中图分类号:TP301. 6 文献标识码:A 文章编号:1673-629X(2019)10-0181-05

doi:10. 3969 / j. issn. 1673-629X. 2019. 10. 035

Research on Face Target Detection Based on SSD

YANG Lu,WU Chen

(School of Computer Science & Technology,Jiangsu University of Science and Technology, Zhenjiang 212003,China)

Abstract:In order to realize the face target detection based on SSD (single shot multibox detector) algorithm,public face data set FDDB

is used to retrain and improve the network model. The network training results are optimized by inputting different face data sets during

training. For solving the problem of over-fitting in the training process of face detection,negative samples are added into the input data

set by the method of self-encoder to generate noise in the training model. The sparse model is produced by L1 regularization,which has

better characteristics to deal with high-dimensional data features,so as to enhance the generalization of the model,achieve the effect of

noise reduction during network iteration training, and prevent the model from falling into over - fitting. Then the candidate box is

determined as the final face detection window for face detection by non-maximum suppression (NMS). The experiment on the training

platform MXnet shows that the mAp (mean average precision) of the face detection model with noise is improved to 0. 997. At the same

time,the robustness of occlusion,illumination and small target detection is improved,and the convergence speed is still fast.

Key words:convolution neural network；SSD algorithm；NMS algorithm；regularization；face detection

0 引言

目标检测是计算机视觉处理和机器学习中一个重

要的课题。目标检测(object detection) 即检测图片中

的目标物体,输出图像中所有目标的坐标框,同时输出

每个目标的具体类别。传统目标检测的方法通常经历

以下步骤:首先在图片上对图像进行分割,找出几千个

候选的区域,然后计算标签与框的重合度筛选出一部

分候选框, 再通过 SIFT ( scale - invariant feature

transform)

「1」

方法对这些候选框进行特征提取,然后训

练分类器将特征区域进行分类输出。首先需要提取图

像中目标的位置信息,一张图像中目标的位置是不确

定的,可能出现在图像的任何位置,加上目标的形状大

小比例都是任意的,因此传统的滑动窗口方法需要设

计不同大小比例的窗口,以固定步幅滑动窗口,遍历整

幅图像的每个区域。很显然这种方法存在实效性低与

计算量过大的缺点,并不适用于实时性要求较高的分

类器,更无法应用到实际场景当中。在实际计算时,出

于对计算成本和后续性能的考虑,设计时窗口的大小

第 29 卷第 10 期

2019 年 10 月

计算机技术与发展

COMPUTER TECHNOLOGY AND DEVELOPMENT

Vol. 29 No. 10

Oct. 2019

万方数据

下载后可阅读完整内容，剩余4页未读，立即下载

anitachiu_2

粉丝: 31
资源: 801

SSD算法在人脸检测中的应用与优化

基于图片的目标目标检测SSD算法

人脸检测正样本（fddb数据库，已经截取好人脸，直接可以拿来训练网络）

tensorflow-face-detection：基于mobilenet SSD的面部检测器，由tensorflow对象检测api驱动，由WIDERFACE数据集训练

基于改进的SSD的人脸识别算法研究.pdf

Python基于OpenCV实现人脸检测并保存.pdf

基于深度学习的轻量级人脸检测模型研究.pdf

基于深度学习的人脸检测算法的研究.pdf

SSD神经网络的人脸检测方法.pdf

旋转人脸检测算法.pdf

基于卡尔曼滤波改进的MTCNN网络人脸检测算法.pdf

最新资源