正负项目集挖掘:基于频繁模式树的关联规则新方法

需积分: 5 0 下载量 120 浏览量 更新于2024-08-11 收藏 338KB PDF 举报
"基于频繁模式树的正负项目集挖掘 (2012年) - 赵旭俊 - 太原科技大学学报 - 第33卷第1期 - 关键词:约束;频繁模式树;负项目集;关联规则" 在传统的关联规则挖掘方法中,如基于支持度和置信度的框架,可能会导致大量的不相关甚至误导性的关联规则,且无法区分正关联规则(积极的关系)和负关联规则(反向的关系)。赵旭俊在2012年的论文中,针对这一问题提出了一个新的方法,旨在提高挖掘效率和针对性。 论文采用一阶谓词逻辑作为表示用户感兴趣模式的背景知识技术。通过结合背景知识,赵旭俊设计了一种包含正负项目集的频繁模式树(Frequent Pattern Tree,简称FP-Tree),并提出了一种名为NCFP-Construct的算法,用于构建针对正负项目集的约束频繁模式树。这种方法考虑了用户的兴趣,能够挖掘出更具有针对性的规则。 在传统的关联规则挖掘中,只关注正关联规则,例如“购买鸡蛋的顾客可能也会购买火腿”。然而,负规则如“购买鸡蛋的顾客很可能不会购买鸭蛋”在决策分析等领域同样重要,因为它提供了全面的决策信息。因此,负规则的挖掘逐渐受到重视。 论文引用了国内外的相关研究,如Brin S首次提出的负相关概念,Savasere A等人的负关联规则思想,以及Do Trong的渐进闭模式算法等。这些研究为负规则挖掘奠定了基础,但各自存在局限性,如需要预定义层次分类结构或不适用于大规模现实世界数据。 赵旭俊的贡献在于通过NCFP-Construct算法解决了这些局限性,能够在不预先设定分类结构的情况下,有效地挖掘出正负项目集的关联规则。实验结果证明了这种方法的有效性,它为关联规则挖掘提供了一个新的视角,尤其是在需要全面信息以支持决策的场景中。 这篇论文深入探讨了如何在关联规则挖掘中整合正负项目集,通过引入背景知识和优化的频繁模式树结构,提升了挖掘的效率和实用性。这种方法对于数据挖掘领域,尤其是需要考虑正负关系的决策分析工作,具有重要的理论和实践价值。