视频人脸数据自动标注:子空间聚类新方法
67 浏览量
更新于2024-08-29
收藏 2.23MB PDF 举报
"本文提出了一种基于子空间聚类的视频人脸数据自动标注方法,旨在解决传统人工标注的高成本和噪声问题。该方法利用海量视频作为数据源,通过人脸识别模型提取特征,采用改进的K近邻算法进行子空间划分,并在每个子空间内运用K均值算法区分正样本、难正样本和负样本,以此构建高质量的人脸数据集。实验结果显示,子空间聚类法在LFW和实际待标注数据上的F1分数分别提升了10%和7%,且标注速度提升至人工标注的10倍。"
本文是关于计算机视觉领域的一个研究,具体聚焦于人脸识别的数据标注问题。随着深度学习技术的发展,数据的质量对人脸识别算法的性能至关重要。现有的人脸数据集,如FRET、LFW、MegaFace和MS-Celeb-1M,虽然促进了人脸识别的进步,但它们的标注过程耗时且容易引入噪声。
作者提出了一种创新的自动标注方法,主要流程包括三个步骤:首先,从大量视频中收集人脸数据,以满足不同人脸识别任务的需求;其次,运用人脸识别模型(可能包括卷积神经网络)将人脸图像转换成特征向量;然后,使用改进的K近邻(KNN)算法将这些特征向量划分为多个子空间,这种方法可以更精确地处理数据的复杂性和多样性;最后,在每个子空间内部,应用K均值算法来区分正样本(同一人的脸部)、难正样本(难以确定身份的脸部)和负样本(非目标人的脸部),从而筛选出难正样本构建高质量的数据集。
实验在LFW公开数据集和未标注的真实数据上进行了验证,结果表明,基于子空间聚类的自动标注方法在F1指标上优于传统的聚类方法,且在效率上有着显著提升,标注速度达到了传统人工标注的10倍。这一成果为后续研究提供了包含200个ID、共计9500张人脸照片的模糊人脸数据集,可广泛应用于多种人脸识别任务,如人脸识别、多姿态识别、跨年龄识别等。
这项工作为解决大规模人脸数据标注问题提供了一个有效且高效的解决方案,对于推动深度学习在人脸识别领域的应用具有重要意义。通过减少人工干预,不仅可以降低成本,还能提高数据的准确性和可用性,进而促进整个人脸识别系统的性能提升。
点击了解资源详情
2021-03-04 上传
2022-06-11 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38741531
- 粉丝: 6
- 资源: 946
最新资源
- 行业文档-设计装置-一种切袋器.zip
- android应用源码高仿天天动听音乐-IT计算机-毕业设计.zip
- Assign3
- SMOK
- Luang:一个文件的简单Lua库即可翻译和格式化文本
- conf-deadlines
- tdd-checkout
- 基于python3.7+Qtpy5+opencv的交通监控图像处理.zip
- Sistemas-Distribuidos
- 网络IO模型 Linux环境下的network IO
- CSVFile
- IBM-Data-Analyst
- youshould:Web应用程序可帮助人们向朋友推荐事物
- node-asbs-dummy-ai:使用 node-asbs-lib 的虚拟船舶 AI
- vc在文件改变时得到通知,文件监控程序
- Famintos-Mobile:Projeto de Desenvolvimento Mobile