视频人脸数据自动标注:子空间聚类新方法

0 下载量 67 浏览量 更新于2024-08-29 收藏 2.23MB PDF 举报
"本文提出了一种基于子空间聚类的视频人脸数据自动标注方法,旨在解决传统人工标注的高成本和噪声问题。该方法利用海量视频作为数据源,通过人脸识别模型提取特征,采用改进的K近邻算法进行子空间划分,并在每个子空间内运用K均值算法区分正样本、难正样本和负样本,以此构建高质量的人脸数据集。实验结果显示,子空间聚类法在LFW和实际待标注数据上的F1分数分别提升了10%和7%,且标注速度提升至人工标注的10倍。" 本文是关于计算机视觉领域的一个研究,具体聚焦于人脸识别的数据标注问题。随着深度学习技术的发展,数据的质量对人脸识别算法的性能至关重要。现有的人脸数据集,如FRET、LFW、MegaFace和MS-Celeb-1M,虽然促进了人脸识别的进步,但它们的标注过程耗时且容易引入噪声。 作者提出了一种创新的自动标注方法,主要流程包括三个步骤:首先,从大量视频中收集人脸数据,以满足不同人脸识别任务的需求;其次,运用人脸识别模型(可能包括卷积神经网络)将人脸图像转换成特征向量;然后,使用改进的K近邻(KNN)算法将这些特征向量划分为多个子空间,这种方法可以更精确地处理数据的复杂性和多样性;最后,在每个子空间内部,应用K均值算法来区分正样本(同一人的脸部)、难正样本(难以确定身份的脸部)和负样本(非目标人的脸部),从而筛选出难正样本构建高质量的数据集。 实验在LFW公开数据集和未标注的真实数据上进行了验证,结果表明,基于子空间聚类的自动标注方法在F1指标上优于传统的聚类方法,且在效率上有着显著提升,标注速度达到了传统人工标注的10倍。这一成果为后续研究提供了包含200个ID、共计9500张人脸照片的模糊人脸数据集,可广泛应用于多种人脸识别任务,如人脸识别、多姿态识别、跨年龄识别等。 这项工作为解决大规模人脸数据标注问题提供了一个有效且高效的解决方案,对于推动深度学习在人脸识别领域的应用具有重要意义。通过减少人工干预,不仅可以降低成本,还能提高数据的准确性和可用性,进而促进整个人脸识别系统的性能提升。