改进ChineseWhispers算法在人脸识别动态聚类中的应用

需积分: 0 0 下载量 37 浏览量 更新于2024-09-06 收藏 1.2MB PDF 举报
"基于Chinese+Whispers的人脸动态聚类.pdf" 本文主要探讨了一种改进的ChineseWhispers算法在人脸识别领域的应用,特别是在动态聚类中的优化。ChineseWhispers算法原本存在两个主要问题:对于小规模数据聚类时结果的随机性较大,以及在处理大规模数据时的效率低下。为了解决这些问题,作者张陈欢和史燕中提出了一种新的策略。 首先,引入了一个阈值P,只对数据规模为P的部分进行ChineseWhispers聚类。这种方式在保持聚类稳定性的同时,提高了算法的效率。通过对数据规模的限制,可以避免全量数据处理导致的计算复杂度增加,从而改善了算法的运行速度。 其次,为了进一步提升聚类速度,他们采用了代表点而非所有数据点来进行聚类更新。这意味着在处理增量数据时,只需要考虑代表点,减少了处理的数据量,使得聚类过程更为高效。 在特征提取阶段,论文采用了深度学习模型,如卷积神经网络(CNN)结合ArcFaceLoss函数,来获取人脸的特征表示。ArcFaceLoss是一种损失函数,能更好地学习到区分性强的人脸特征。接着,通过计算特征向量之间的余弦距离来衡量样本间的相似性,这是度量人脸特征匹配程度的一种常用方法。 在聚类策略上,选择类中心作为每个类别的代表点,以简洁地描述类别信息。最后,利用增量聚类的框架,该算法可以适应大规模数据流,并实现实时的人脸动态聚类。这种方法在LFW、VGGFace2和CASIA-Webface这三个广泛使用的人脸识别数据集上进行了验证,实验结果显示,改进后的ChineseWhispers人脸动态聚类算法在时间和效率上都有显著提升,时间复杂度从原来的O(n^2)降低到O(n*p)。 总结来说,这篇论文的核心贡献在于提供了一种改进的ChineseWhispers算法,它有效地解决了原始算法的局限性,特别适合于大规模人脸数据的动态聚类任务。这种优化策略不仅提高了聚类的稳定性,还显著提升了处理速度,对于实时人脸识别系统和大数据环境下的人脸分析具有重要的实际应用价值。