网格密度影响因子的多密度聚类算法:提高聚类精度与边界捕捉

需积分: 13 3 下载量 167 浏览量 更新于2024-09-08 收藏 1.43MB PDF 举报
该篇论文深入探讨了一种基于网格密度影响因子的多密度聚类算法。首先,作者提出了"网格密度影响因子"(IFGD)这一概念,这是一个创新性的统计工具,它考虑了相邻网格的综合影响,并且通过加权处理,有效地量化了每个网格单元的相对密度。这个因子不仅有助于识别出数据集中不同密度的聚类,还能区分那些由多个密度类别组成的复杂数据集。 算法的核心思想是利用IFGD来筛选高密度网格单元,这些单元被视为聚类的核心。从这些高密度单元出发,算法通过逐步扩展的方式构建聚类的骨架结构,这有助于确保聚类的准确性和完整性。在处理过程中,边缘网格的边界点识别和提取也是一个关键步骤,这有助于提高聚类的精确度,特别是在捕捉和定义聚类边界时。 论文作者通过对不同大小和形状聚类的实验验证,证实了这种新算法的有效性。它不仅能适应各种类型的聚类,而且在处理包含多个密度层次的数据集时表现出色,能够准确地识别各类别的构成。聚类结果表明,该算法在保持聚类内部紧密度的同时,也能够清晰地划定各聚类之间的界限。 此外,作者还强调了论文的研究背景,包括来自四川省高校重点实验室、四川理工学院人才引进项目以及校级培育项目的资金支持。作者团队由讲师杨善红、教授梁金明和讲师李静雯组成,他们的研究领域涵盖了网格计算、任务调度、人工智能和分布式计算等多个方面。 总结来说,这篇论文提供了一种新颖的网格聚类方法,其核心是网格密度影响因子的引入,这对于处理多密度、复杂形状的聚类问题具有重要的理论价值和实践意义。通过实验验证,该算法展示了其在聚类精度和边界识别方面的优越性能,有望在实际的IT应用中发挥重要作用。