改进ChineseWhispers算法:人脸动态聚类提升效率

需积分: 50 10 下载量 161 浏览量 更新于2024-09-03 收藏 1.2MB PDF 举报
本文主要探讨了"基于Chinese+Whispers的人脸动态聚类"这一主题,针对ChineseWhispers算法在处理小规模数据时易受随机性影响且处理大规模数据速度较慢的问题,提出了一种改进的算法策略。ChineseWhispers算法是一种基于迭代的图聚类方法,它通过消息传递过程将相似的节点连接起来,形成聚类。 首先,研究者在原有的算法基础上引入了一个关键参数P,当数据规模小于P时,使用ChineseWhispers进行聚类,这既能确保聚类结果的稳定性,又提高了算法在处理小规模数据时的效率。其次,他们采用了代表点策略,而非对所有数据点进行操作,这样在处理增量数据时能显著减少计算量,从而提升聚类速度。这种策略特别适用于大规模人脸动态数据的处理,因为它减少了不必要的计算负担。 为了提取人脸特征,研究者结合了卷积神经网络(CNN)和ArcFaceLoss,这是一种常用的深度学习技术,能有效捕捉人脸的特征信息。在相似度度量方面,采用了余弦距离,这是一种常见的向量空间距离度量,对于人脸识别和聚类非常合适。类中心被用作代表点来描述每个类别,这是聚类算法中的经典做法,有助于简洁地表达每个类别的特性。 本文还构建了一个增量聚类的算法架构,这意味着在处理不断增长的人脸数据流时,算法能够实时适应并保持高效。实验在LFW、VGGFace2和CASIA-Webface这三个公开的人脸数据集上进行了验证,结果显示,改进的ChineseWhisper算法显著提高了人脸动态聚类的时间效率,将原算法的时间复杂性从O(n^2)降低到O(n*p),这对于实时处理大量人脸数据具有重要的实际意义。 这项工作针对ChineseWhispers算法的局限性提出了创新性的解决方案,展示了如何通过优化策略和深度学习技术来提升大规模人脸动态聚类的性能,为相关领域的研究和实际应用提供了有价值的方法。