三支决策驱动的谱聚类算法:决策风险降低与性能提升

2 下载量 194 浏览量 更新于2024-08-26 收藏 451KB PDF 举报
本文主要探讨了"基于三支决策的谱聚类算法研究"这一主题,发表在2018年9月的《南京师大学报(自然科学版)》第41卷第3期。传统硬聚类方法,如K-means或层次聚类,强调每个对象必须明确归属于一个类别,但这可能导致对不确定对象的过度决定,增加了决策风险。三支决策理论提出了一种新的处理策略,它将确定的对象置于核心域,而不确定的对象则延迟至边界域,以此减少决策失误。 作者们将这种理念融入谱聚类算法中,谱聚类是一种利用图论中的拉普拉斯矩阵进行数据聚类的方法,尤其适合处理高维非凸数据。他们提出的三支谱聚类算法通过扩展传统谱聚类的过程,首先通过谱聚类得到每类簇的上界,然后通过扰动分析来区分核心域和边界域。核心域代表确定的成员,边界域包含那些尚未明确归属的元素。这种方法的关键在于通过分层决策,降低了对不确定性的依赖,提高了聚类的准确性和稳定性。 实验结果表明,三支谱聚类算法在UCI数据集上表现出色,显著提升了聚类准确度(ACC)、平均精度(AS)和ARI指数,同时减少了噪声和模糊度的衡量指标DBI值。这证明了将三支决策理论应用于谱聚类能够有效改进聚类效果,对于处理现实世界中存在不确定性的数据集具有重要的实践价值。 该研究的创新之处在于将复杂决策理论与数学工具相结合,为数据挖掘领域提供了新的视角和方法。它不仅有助于提升聚类的质量,还为未来的决策支持系统和数据分析提供了一种更为稳健的处理策略。此外,由于得到了国家自然科学基金的支持,该工作对于学术界和工业界都具有一定的理论支撑和应用潜力。