基于遗传算法的连续属性数据关联规则挖掘新方法

需积分: 10 3 下载量 112 浏览量 更新于2024-09-06 1 收藏 238KB PDF 举报
本文主要探讨了"具有连续属性数据的关联规则挖掘"这一领域,由朱彦廷撰写,发表在中国科技论文在线。朱彦廷作为一名讲师,他的研究兴趣集中在人工智能和数据挖掘上,电子邮箱为lpdyh@163.com,他在广西现代职业技术学院计算机系工作。 论文的核心问题是处理数据中的连续属性,这是传统关联规则挖掘的一个挑战。作者提出了一个创新的编码方法,特别设计了一种两段编码策略,旨在将连续属性离散化,以便于在关联规则挖掘过程中进行有效的处理。这种编码方法将连续属性的范围划分为两个部分,通过将连续值转化为离散区间,使得它们能够适应传统的关联规则挖掘算法,如Apriori或FP-Growth等。 同时,作者将遗传算法与这个编码方法结合起来,目的是增强搜索效率并避免过早收敛,也就是所谓的“早熟”现象。遗传算法是一种启发式搜索技术,它模拟自然选择和遗传机制来优化问题解决方案。通过引入小生境策略,算法能够在搜索过程中更好地探索可能的解空间,提高规则发现的质量和准确性。 实验部分展示了新算法的有效性,通过对具有连续属性数据集的测试,证明了它不仅能够处理连续数据,而且能够生成高质量的关联规则,这对于那些依赖于关联规则分析的实际应用领域,如市场营销、供应链管理等具有显著的意义。 总结起来,这篇论文的主要贡献在于提出了一种新的方法来处理数据挖掘中的连续属性问题,结合遗传算法和特定的编码策略,有效解决了关联规则挖掘在连续数据上的挑战。这种方法为关联规则挖掘领域的研究者提供了一个新的视角和工具,有助于推动该领域的发展。