革新关联规则挖掘:等可能性框架与遗传算法的应用

需积分: 0 0 下载量 151 浏览量 更新于2024-09-06 收藏 424KB PDF 举报
本文主要探讨了一种创新的关联规则挖掘方法,由金喜子、张雪峰和赵连朋等人在东北师范大学计算机学院提出。他们针对传统的支持度-可信度框架,引入了一种基于事务等可能性的倾向度——相依度框架。这种新框架强调的是事件发生的倾向程度和事件之间的相互依赖性,相较于传统的度量方式,它提供了更为直观的描述事件因果关系的方法,有助于解决关联规则挖掘中的冗余问题。 在这个框架中,遗传算法被巧妙地应用到规则发现过程中,特别是通过一种新颖的素因子编码方法来优化染色体编码。这种方法有效地压缩了事务数据库D的存储空间,提高了计算效率。作者指出,他们的遗传算法在寻找有价值的规则时,在效率和精度上表现出优势。 研究背景起源于1993年R.Agrawal等人提出的关联规则挖掘技术,它在数据挖掘领域具有重要意义,被广泛应用于商业分析、金融决策、科学研究、情报分析及军事等多个领域。尽管已有许多学者通过FP_tree、最大频繁模式挖掘、分布式挖掘、多时间序列关联模式挖掘等多种算法和方法对关联规则挖掘进行了深入研究,但这些工作大多集中在完善支持度-可信度框架。 然而,金喜子等人提出的基于等可能性的框架提供了一个不同的视角,挑战了既有的理论边界。他们的方法不仅扩展了关联规则挖掘的理论基础,而且在实际应用中展示了潜在的优势。这个研究对于那些寻求提高关联规则挖掘性能和理解事件复杂性关联的领域具有重要价值,可能引领未来数据挖掘领域的进一步发展。