视频人脸数据自动标注：子空间聚类新方法

67 浏览量更新于2024-08-29 收藏 2.23MB PDF 举报

"本文提出了一种基于子空间聚类的视频人脸数据自动标注方法，旨在解决传统人工标注的高成本和噪声问题。该方法利用海量视频作为数据源，通过人脸识别模型提取特征，采用改进的K近邻算法进行子空间划分，并在每个子空间内运用K均值算法区分正样本、难正样本和负样本，以此构建高质量的人脸数据集。实验结果显示，子空间聚类法在LFW和实际待标注数据上的F1分数分别提升了10%和7%，且标注速度提升至人工标注的10倍。" 本文是关于计算机视觉领域的一个研究，具体聚焦于人脸识别的数据标注问题。随着深度学习技术的发展，数据的质量对人脸识别算法的性能至关重要。现有的人脸数据集，如FRET、LFW、MegaFace和MS-Celeb-1M，虽然促进了人脸识别的进步，但它们的标注过程耗时且容易引入噪声。作者提出了一种创新的自动标注方法，主要流程包括三个步骤：首先，从大量视频中收集人脸数据，以满足不同人脸识别任务的需求；其次，运用人脸识别模型（可能包括卷积神经网络）将人脸图像转换成特征向量；然后，使用改进的K近邻（KNN）算法将这些特征向量划分为多个子空间，这种方法可以更精确地处理数据的复杂性和多样性；最后，在每个子空间内部，应用K均值算法来区分正样本（同一人的脸部）、难正样本（难以确定身份的脸部）和负样本（非目标人的脸部），从而筛选出难正样本构建高质量的数据集。实验在LFW公开数据集和未标注的真实数据上进行了验证，结果表明，基于子空间聚类的自动标注方法在F1指标上优于传统的聚类方法，且在效率上有着显著提升，标注速度达到了传统人工标注的10倍。这一成果为后续研究提供了包含200个ID、共计9500张人脸照片的模糊人脸数据集，可广泛应用于多种人脸识别任务，如人脸识别、多姿态识别、跨年龄识别等。这项工作为解决大规模人脸数据标注问题提供了一个有效且高效的解决方案，对于推动深度学习在人脸识别领域的应用具有重要意义。通过减少人工干预，不仅可以降低成本，还能提高数据的准确性和可用性，进而促进整个人脸识别系统的性能提升。

电子设计工程

Electronic Design Engineering

第 27卷

Vol.27

第 21期

No.21

2019年 11月

Nov. 2019

收稿日期：2019-04-10 稿件编号：201904066

基金项目：国家自然科学基金（61702491）

作者简介：王锟朋（1993—），男，山东烟台人，硕士研究生。研究方向：计算机视觉，深度学习。

深度学习算法的涌现推动了人脸识别算法的快

速发展。数据驱动的深度学习方法，其模型的鲁棒

性与数据的质量密切相关。从早期的 FERET 人脸

数据集，到之后的 LFW

[1]

人脸数据集，再到近年来的

MegaFace

[2- 3]

、MS-Celeb-1M

[4]

数据集，人脸数据集成

为驱动人脸识别算法发展的主要因素之一

[5]

。

但是现有的人脸数据集，无论是针对通用人脸

识别任务的大规模数据集，还是针对多姿态、跨年龄

等特殊人脸识别任务的小规模数据集，其数据标注

基于子空间聚类的视频人脸数据自动标注

王锟朋

1，2

，钟汇才

（1.中国科学院微电子研究所，北京 100029；2.中国科学院大学北京 100049）

摘要：针对人脸数据标注所需的人工和时间成本巨大，标注出的人脸数据集含有较多噪声问题，提

出一种基于子空间聚类的视频人脸数据自动标注方法。首先，将海量视频作为人脸数据的采集来

源，以满足多种人脸识别任务中不同的人脸数据需求，然后使用人脸识别模型将人脸数据映射到

特征空间，使用改进 K 近邻算法把人脸数据划分到不同的子特征空间，最后在每个子特征空间内使

用 K 均值算法分离人脸数据中的正样本、难正样本与负样本，收集难正样本构建人脸数据集。实验

在公开数据集 LFW 与真实待标注数据上进行，实验结果表明子空间聚类法的 F1 度量得分比传统

聚类算法分别提高了 10%和 7%，数据标注速度达到传统人工标注的 10 倍。使用该方法建立了一

个包含 200 个 ID、9 500 张人脸照片的模糊人脸数据集，可用于多种人脸识别问题的研究。

关键词：数据标注；聚类；人脸识别；K 近邻；卷积神经网络

中图分类号：TN919.8 文献标识码：A 文章编号：1674-6236（2019）21-0164-08

Automatic annotation of face data from videos based on subspace clustering

WANG Kun⁃peng

1，2

，ZHONG Hui⁃cai

（1. Institute of Microelectronics of Chinese Academy of Sciences，Beijing 100029，China；2. University of

Chinses Academy of Sciences，Beijing 100049，China）

Abstract: In order to solve the problems of the huge labor and time costs on data annotation，lots of

noises in annotated face data，we propose an automatic annotation method of face data from videos based

on subspace clustering. Firstly，a huge number of videos are utilized as the source of face data，offering

different kinds of data for different face recognition tasks. Secondly，map face data into feature space by

using face recognition model，and divide feature space into subspaces by improved K- nearest neighbor

algorithm. Finally，K- means clustering algorithm is utilized in every subspace to divide face data into

positive samples，hard positive samples and negative samples，then hard positive samples are collected

for data annotation. Experiments are conducted on LFW dataset and face data from videos without

annotation. The results show that the proposed method gains 10% and 7% higher F1 measure score than

traditional clustering algorithm and the proposed method makes face data annotation 10 times faster than

manual annotation. In addition，a blur face dataset containing 200 ID with 9 500 faces is built by the

proposed method and can be used for many face recognition tasks.

Key words: data annotation；cluster；face recognition；K- nearest neighbor；convolutional neural

network

--164

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38741531

粉丝: 6
资源: 946

视频人脸数据自动标注：子空间聚类新方法

解决不平衡与大规模数据：基于样本的子空间聚类方法

通过Garbor子空间亲和力和自调整谱聚类进行无监督的面部姿势分组

【图像识别-人脸识别】基于BP神经网络、支持向量机和LVQ神经网络实现人脸朝向的识别附matlab代码.zip

谱聚类提升多类问题的ECOC鉴别纠错：新方法与应用对比

聚类算法的高级优化：基于子空间的聚类

Java算法自学与大数据处理：算法在海量数据中的应用

基于传统机器学习的目标检测算法

学习使用Python进行图像处理与数据预处理

跨模态学习新策略：多源数据融合的关键方法

非结构化数据处理：人工智能算法的突破性进展

最新资源