基于eVQ聚类的增量模糊关联分类提升效率

0 下载量 55 浏览量 更新于2024-08-29 收藏 281KB PDF 举报
本文主要探讨了"基于演进向量量化聚类的增量模糊关联分类方法"这一主题,针对动态数据集中的模糊关联分类问题,提出了一种创新的算法。该方法旨在提高在处理实时变化的数据时,模糊关联分类器(FAC)的构建效率和性能。 首先,研究者利用了进化向量量化(eVQ)聚类算法,这是一种数据压缩和编码技术,通过增量方式更新数量属性上的高斯隶属度函数参数。高斯隶属度函数是模糊集合理论的基础,它定义了样本与类别之间的隶属程度,而eVQ聚类的引入使得这个过程更为高效,能够适应数据流中的实时变化。 其次,文章扩展了早剪枝更新(UWEP)算法,使其适应于增量挖掘模糊频繁项。早剪枝是一种用于挖掘频繁项集的方法,但在模糊关联规则中,由于模糊性,需要特殊处理。通过增量策略,算法能够在保证挖掘效果的同时,降低计算复杂性。 接着,以模糊相关度(FCORR)和分类规则前件长度为度量标准,对模糊关联分类规则库进行裁剪和更新。模糊相关度衡量的是规则的关联强度,而规则前件长度则反映了规则的简洁性。这两种度量在保持规则有效性和解释性的同时,确保了模型的优化和效率。 通过在四个UCI标准数据集上的实验,研究者验证了这种增量模糊关联分类方法相较于传统的批量建模方法,能够在保证分类精度和规则可解释性的同时,显著减少训练时间。特别是,基于eVQ的高斯隶属度函数增量更新策略,在动态数据环境中提高了分类精度,这对于实时分析和预测任务具有实际应用价值。 本文的研究贡献在于提供了一种针对动态数据的增量学习策略,有效地提升了模糊关联分类的性能,并为处理大规模、高维度和实时变化的数据集提供了一种实用的解决方案。关键词包括增量学习、模糊关联分类、进化向量量化聚类以及早剪枝更新等,这些都是深入理解本研究的关键概念。