"基于Weka的数据挖掘实验报告:威斯康辛乳腺癌分类算法性能比较分析"
38 浏览量
更新于2023-12-22
2
收藏 987KB DOC 举报
数据挖掘实验报告.doc,是关于数据挖掘课程的实验报告,使用Weka平台对乳腺癌数据集进行分类的实验。实验的目的是运用数据挖掘中的分类算法对数据集进行分类,并对算法结果进行性能比较,同时针对不同数量的训练集进行对比实验。实验使用了来自http://archive.ics.uci.edu/ml/Datasets/Breast Cancer Wisconsin (Original)的数据,主要使用其中的Breast Cancer Wisconsin (Original) Data Set数据。实验环境采用Weka平台,Weka是一款免费的,非商业化的机器学习以及数据挖掘软件,提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。
实验步骤分为数据预处理和分类算法性能比较。数据预处理阶段针对威斯康辛州(原始)的乳腺癌数据集进行分类,数据属性包括样本代码,丛厚度,细胞大小,细胞形状,边际粘连,上皮细胞大小,裸核,染色质,核仁,有丝分裂和分类。通过实验,希望能找出患乳腺癌客户各指标的分布情况。在分类算法性能比较阶段,对不同数量的训练集进行对比实验,并画出性能比较图。实验的目的是通过比较算法结果,找到最适合该数据集的分类算法。
实验结果分析显示,基于Weka平台的分类算法在对乳腺癌数据集进行分类方面取得了较好的效果。性能比较图显示,在不同数量的训练集下,各分类算法的性能表现有所不同,但整体来看,分类算法在该数据集上都表现出了较高的准确性和稳定性。通过实验,对乳腺癌数据集的分类算法性能进行了全面的比较,为进一步研究提供了重要的参考。
综上所述,本次实验主要是基于Weka平台对乳腺癌数据集进行分类的实验,实验结果表明,Weka平台的分类算法在该数据集上取得了较好的性能。实验报告对数据挖掘课程的学习和实践具有一定的参考价值,为进一步研究和实践提供了重要的指导。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-09-28 上传
2021-10-01 上传
2022-12-23 上传
2022-12-23 上传
是空空呀
- 粉丝: 197
- 资源: 3万+
最新资源
- -ImportExcelOnec
- learning-web-technologies-spring-2020-2021-sec-h
- msgpack-rpc-jersey-blank:使用Jetty + Jersey + Jackson + MessagePack的现代Java RPC堆栈
- QQ自动点赞源码-易语言
- Simu5G:Simu5G-用于OMNeT ++和INET的5G NR和LTELTE-A用户平面仿真模型
- rust_template::crab:Rust项目模板。 只需运行init.py
- mvuehr:微人事前端
- SRC:HAB沙箱
- babylon:Web应用程序允许语言变量的国际化
- grunt-less-branding:根据品牌处理 LESS 文件
- neo_spacecargo:示例双向遍历扩展
- Frotend_Facturacion
- jsonotron:一个用于管理基于JSON模式的类型系统的库
- angular-task-1:Angular第一项任务:库存管理应用
- sclc:狮子座的约会约会系统
- NUCLEO-H745 CUBEIDE tcp通讯