收稿日期:2018-12-03 修回日期:2019-04-04 网络出版时间:2019-06-26
基金项目:国家自然科学基金(61572242)
作者简介:杨 璐(1994-),女,硕士研究生,研究方向为计算机视觉处理、深度学习;吴 陈,博士,教授,硕导,研究方向为智能信息处理、模式
识别。
网络出版地址:http:/ / kns. cnki. net / kcms / detail / 61. 1450. TP. 20190627. 1720. 092. html
基于 SSD 算法的人脸目标检测的研究
杨 璐,吴 陈
(江苏科技大学 计算机学院,江苏 镇江 212003)
摘 要:为实现 SSD 算法模型对人脸的目标检测,采用公开人脸数据集 FDDB 对网络模型进行重新训练改进。 通过训练
时输入不同的人脸数据集来优化网络训练结果。 针对人脸检测训练过程中的过拟合问题,通过降噪自编码器的方法,在
输入数据集中加入负样本,在训练模型中生成噪声。 通过 L1 正则化产出稀疏模型,稀疏模型具有更好的特性去处理高维
的数据特征以增强模型的泛化能力,实现在网络迭代训练过程中降噪的效果,防止模型陷入过拟合。 然后通过非极大值
抑制算法(NMS)使候选框确定为最终的人脸检测窗口进行人脸检测。 在训练平台 MXnet 下的实验结果表明,加入噪声后
的人脸检测模型的 mAp(mean average precision)性能提高至 0. 997,同时在提高遮挡、光照、小目标等检测的鲁棒性的情况
下,仍保持较快的收敛速度。
关键词:卷积神经网络;SSD 算法;NMS 算法;正则化;人脸检测
中图分类号:TP301. 6 文献标识码:A 文章编号:1673-629X(2019)10-0181-05
doi:10. 3969 / j. issn. 1673-629X. 2019. 10. 035
Research on Face Target Detection Based on SSD
YANG Lu,WU Chen
(School of Computer Science & Technology,Jiangsu University of Science and Technology, Zhenjiang 212003,China)
Abstract:In order to realize the face target detection based on SSD (single shot multibox detector) algorithm,public face data set FDDB
is used to retrain and improve the network model. The network training results are optimized by inputting different face data sets during
training. For solving the problem of over-fitting in the training process of face detection,negative samples are added into the input data
set by the method of self-encoder to generate noise in the training model. The sparse model is produced by L1 regularization,which has
better characteristics to deal with high-dimensional data features,so as to enhance the generalization of the model,achieve the effect of
noise reduction during network iteration training, and prevent the model from falling into over - fitting. Then the candidate box is
determined as the final face detection window for face detection by non-maximum suppression (NMS). The experiment on the training
platform MXnet shows that the mAp (mean average precision) of the face detection model with noise is improved to 0. 997. At the same
time,the robustness of occlusion,illumination and small target detection is improved,and the convergence speed is still fast.
Key words:convolution neural network;SSD algorithm;NMS algorithm;regularization;face detection
0 引 言
目标检测是计算机视觉处理和机器学习中一个重
要的课题。 目标检测(object detection) 即检测图片中
的目标物体,输出图像中所有目标的坐标框,同时输出
每个目标的具体类别。 传统目标检测的方法通常经历
以下步骤:首先在图片上对图像进行分割,找出几千个
候选的区域,然后计算标签与框的重合度筛选出一部
分 候 选 框, 再 通 过 SIFT ( scale - invariant feature
transform)
「1」
方法对这些候选框进行特征提取,然后训
练分类器将特征区域进行分类输出。 首先需要提取图
像中目标的位置信息,一张图像中目标的位置是不确
定的,可能出现在图像的任何位置,加上目标的形状大
小比例都是任意的,因此传统的滑动窗口方法需要设
计不同大小比例的窗口,以固定步幅滑动窗口,遍历整
幅图像的每个区域。 很显然这种方法存在实效性低与
计算量过大的缺点,并不适用于实时性要求较高的分
类器,更无法应用到实际场景当中。 在实际计算时,出
于对计算成本和后续性能的考虑,设计时窗口的大小
第 29 卷 第 10 期
2019 年 10 月
计 算 机 技 术 与 发 展
COMPUTER TECHNOLOGY AND DEVELOPMENT
Vol. 29 No. 10
Oct. 2019
万方数据