WEKA教程:参数设置与关联规则挖掘实战
需积分: 25 121 浏览量
更新于2024-08-13
收藏 1.43MB PPT 举报
这篇资源主要介绍了如何使用数据挖掘工具WEKA进行参数设置练习,特别是针对关联规则的挖掘。WEKA是一个广泛使用的开源数据挖掘软件,它提供了丰富的机器学习算法和数据预处理功能。在这个教程中,有两个主要的任务:
任务一的目标是挖掘支持度在10%到100%之间,并且提升度超过1.5的关联规则,同时这些规则必须在提升度排名中位于前100位。为了实现这一目标,用户需要设置以下参数:
- `lowerBoundMinSupport` 设置为0.1,表示最小支持度为10%
- `upperBoundMinSupport` 设置为1,表示最大支持度为100%
- `metricType` 设为 `lift`,即选择提升度作为评价标准
- `minMetric` 设为1.5,确保挖掘出的规则提升度不低于1.5
- `numRules` 设为100,限制返回的关联规则数量不超过100个
任务二则关注挖掘支持度在10%到100%之间,置信度超过0.8,并且置信度排在前100位的分类关联规则。为此,需要调整以下参数:
- `car` 设为 `True`,意味着我们要找的是分类关联规则
- `metricType` 设为 `confidence`,因为此任务要求基于置信度进行挖掘
- `minMetric` 设为0.8,确保挖掘出的规则置信度不小于0.8
- `numRules` 同样设为100,即最多返回100条规则
课程结构涵盖了WEKA的基本操作,包括数据格式、数据准备、属性选择、可视化分析、分类预测、关联分析、聚类分析以及如何扩展WEKA。学习者需要熟悉整个数据挖掘流程,包括数据预处理、选择合适的算法和参数、运行实验以及评估结果。此外,还涉及如何在WEKA中添加新的算法。
WEKA因其强大的功能和易用性,已经成为数据挖掘领域的重要工具。它支持ARFF文件格式,这种格式便于存储属性与实例信息。通过WEKA,用户可以执行各种复杂的数据挖掘任务,如预处理、分类、回归、聚类和关联规则挖掘等。WEKA不仅包含了大量内置的机器学习算法,还允许用户自定义算法,以满足特定的分析需求。
点击了解资源详情
396 浏览量
点击了解资源详情
2021-05-19 上传
118 浏览量
224 浏览量
130 浏览量
永不放弃yes
- 粉丝: 917
- 资源: 2万+
最新资源
- 靛蓝1
- 简洁大气喜庆新年风春节主题ppt模板
- mysql安装配置详细教程.zip
- CATS Movie HD Wallpapers Theme-crx插件
- 屏蔽鼠标右键特效代码
- PHP实例开发源码-易运维(一站式运维管理系统) v2.0.zip
- 创建任意多个文件和文件夹的python脚本,用于测试create.zip
- AI_CS6_SDK_Win_682.6 版本
- 2020_1_CDM_AppHerois:不能重复使用SQLite的布局,不希望使用任何其他东西
- Needs More Glitter-crx插件
- Yahtzee-JS:Yahtzee(始于2002年)-HTML,JavaScript和CSS
- 最新vscode安装教程.zip
- jq鼠标滚动视差效果特效代码
- github-users-finder:一个简单的GitHub users finder应用程序
- 2015 0ctf exploit freenote 400.rar
- Windows下与USB通信、HID通信源码