基于小生境的NGEP算法:提升关联规则挖掘效率

需积分: 5 0 下载量 139 浏览量 更新于2024-08-11 收藏 375KB PDF 举报
本文主要探讨了一种创新的关联规则挖掘方法,即"基于小生境技术的基因表达式编程进化算法"(Novel Algorithm GEP based on Niche, 简称NGEP),它是在2009年由陈云亮、李欣、杨捷和谢长生四位作者在《计算机科学》杂志上发表的研究成果。面对大数据集处理时,传统关联规则挖掘算法可能面临效率低下和精确度不足的问题。为解决这些问题,研究人员将基因表达式编程进化算法(Gene Expression Programming, GEP)与小生境技术相结合。 小生境技术是一种模仿自然生态中的物种竞争和共生现象,通过划分多个小生境,每个小生境内只包含部分个体,这样可以增强种群的多样性,避免过度竞争导致的性能下降。在NGEP算法中,首先通过小生境演化过程,筛选出各小生境内的优秀个体,然后进行同构个体的剔除,以确保算法的创新性和有效性。接下来,通过笛卡儿交叉操作,将不同小生境的解进行融合,以产生更高质量的关联规则候选。 实验结果显示,与同类优秀算法相比,NGEP在保持高精度的同时,显著提高了种群多样性,这有利于发现更多潜在的有效关联规则。此外,算法在处理大数据集时,其规则提取的效率也得到了显著提升,这在实际应用中具有重要的价值,尤其是在商业智能分析、市场趋势预测等领域。 本文的主要贡献在于提出并实现了一种新的关联规则挖掘工具——NGEP,通过小生境技术和GEP的结合,优化了大数据集下的规则挖掘性能,为数据挖掘领域提供了一个有效的解决方案。这个研究不仅推动了关联规则挖掘技术的发展,也为其他领域的进化计算策略提供了新的启示。