关联规则挖掘:新模型与正负相关探索
需积分: 8 96 浏览量
更新于2024-08-12
收藏 204KB PDF 举报
"关联规则挖掘的新模型 (2004年) - 刘建华 - 福建师范大学学报(自然科学版) - 文章编号 1000-5277(2004)02-0032-04 - TP392 - A"
关联规则挖掘是数据挖掘领域中的一个重要分支,它旨在发现数据集中物品之间的有趣关系,这些关系通常以形式化的规则表示,如“如果购买了商品A,那么也有可能购买商品B”。经典的关联规则模型基于支持度(Support)和置信度(Confidence)这两个核心度量标准。
支持度定义了一个项集(例如,商品组合)在所有交易中出现的频率,计算公式为:Support(X) = 频繁项集X在所有交易中出现的比例。置信度则表示在已知项集X出现的情况下,项Y出现的概率,计算公式为:Confidence(X→Y) = Support(X∪Y) / Support(X)。
然而,传统关联规则模型存在一些局限性。首先,它主要关注正相关关系,即两个项同时出现的情况,而忽略了可能存在的负相关关系,比如“购买A商品的人较少购买B商品”。其次,该模型可能产生大量的冗余规则,这增加了用户的分析负担。此外,支持度和置信度的阈值设定直接影响到挖掘结果的数量和质量,选择合适的阈值并不总是直观的。
刘建华在论文中分析了这些不足,提出了一个新的关联规则模型,旨在增强对正相关和负相关规则的挖掘能力。这个新模型可能包括对原有支持度和置信度的扩展或调整,例如引入新的度量指标来捕捉负相关性,或者通过改进的算法减少冗余规则的产生。这样的改进使得用户能够更全面地了解数据集中的各种关联,从而获得更有价值的洞察。
在实际应用中,关联规则挖掘广泛应用于市场篮子分析、推荐系统、网络日志分析等多个领域。新的关联规则模型能够帮助业务决策者发现潜在的市场趋势,优化营销策略,或者提高系统推荐的准确性。通过深入研究和优化这些度量标准,我们可以更好地理解数据背后隐藏的模式,进一步提升数据挖掘的效率和效果。
2021-05-18 上传
157 浏览量
点击了解资源详情
2021-05-09 上传
2021-05-09 上传
2021-04-27 上传
2021-05-12 上传
2021-05-24 上传
2021-05-12 上传

weixin_38570202
- 粉丝: 9
最新资源
- 服务器监控与日志管理的.p文件上传策略
- Visual C++网络编程案例源代码精解(前四章)
- Nihao3d:探索Flash3D学习的最佳实践平台
- Vue2日期选择器组件:vue2-datepicker的介绍与使用
- 全技术栈源码资源:灰色iso苹果风格WAP企业网站模板
- tcomb-form-redux-test开发环境启动指南
- 利用Ext JS与Asp.Net MVC 3实现CMS用户管理后台系统
- 英文版man手册CHM文件的介绍与应用
- 全面解析Firebase与OpenCV在网站开发中的应用教程
- 十大Android案例应用源码免费下载学习
- Java JDK 1.8 64位版下载安装教程
- 分析非对称三角后缘调制数字V-2控制Buck变换器
- android省市联动实现技巧与源码解析
- Qt中间件微型Web框架递归技术实现解析
- Hough变换项目:直线检测技术详解
- 变频器工程应用与参数设置实例分析