基于兴趣度的正负项目关联规则挖掘:有效性与可行性研究

需积分: 10 2 下载量 135 浏览量 更新于2024-08-12 1 收藏 376KB PDF 举报
本文主要探讨了"基于兴趣度含正负项目的关联规则挖掘方法",发表于2010年5月的电子科技大学学报。随着项目的引入,传统的关联规则挖掘在频繁项集的大小和关联规则数量上面临挑战,特别是在处理包含正负项目的数据时。为了克服这个问题,研究者提出了一种新的策略,即通过引入兴趣度来控制频繁项集内关联规则的提取。 兴趣度模型是解决这一问题的关键,它能够筛选出具有较高价值的规则,避免冗余和不重要的发现。作者分析了现有的兴趣度模型,经过评估后选择了适合处理含正负项目的数据集的方法。他们进一步探讨了置信度在关联规则挖掘中的重要性,并在此基础上定义了一个新的性质,用于指导含正负项目的频繁项集关联规则挖掘算法的设计。 文章的核心部分涉及算法的具体描述,包括如何处理正负项目带来的复杂性,以及如何在计算置信度时考虑到它们的影响。此外,还讨论了矛盾关联规则的概念,即规则中同时包含正面和负面条件的情况,这种类型的规则可能揭示出数据中隐藏的模式和冲突。 实验结果显示,这个基于兴趣度的算法在实际应用中是有效且可行的。它能够有效地减少频繁项集的规模,降低关联规则的数量,从而提高挖掘效率,同时保持规则的精确性和实用性。关键词包括关联规则、置信度、兴趣度和负项目,这些概念共同构成了论文的核心研究内容。 本文的研究成果对于理解和优化数据挖掘特别是处理含有正负项目的关联规则挖掘具有重要意义,有助于提升数据处理的针对性和效率,为实际业务场景提供有价值的规则支持。该研究不仅在理论上深化了关联规则挖掘的理解,也在实践层面提供了实用的技术工具。