MATLAB实现数据挖掘：粗糙集与关联规则探讨

版权申诉

5星 · 超过95%的资源 136 浏览量更新于2024-08-07 收藏 22KB DOCX 举报

在【老生谈算法】文档中，作者探讨了如何使用MATLAB实现数据挖掘的过程，重点关注了一种特定的算法应用。数据挖掘的核心在于揭示隐藏在大量数据中的有价值信息，它结合了多种技术如机器学习、数理统计、神经网络等，其目的是通过知识发现(KDD)来提取模式，如分类、聚类、关联规则和序列模式等。首先，确定数据挖掘的目标是至关重要的。这涉及到理解任务的范围，比如可能的目标是预测、分类或者发现潜在的关联。数据挖掘流程包括数据准备、挖掘过程和结果评估三个主要步骤，强调了数据预处理的重要性，如去除噪声、填充缺失值、去重以及数据类型转换，以便于后续的算法应用。本文选择的算法基于粗糙集理论，这是一种处理不确定性和不完全信息的方法。它通过属性约简来构建决策表，同时采用后离散化策略处理连续属性，实现了效率和信息损失之间的平衡。为了衡量属性之间的相关性，引入了相对值条件互信息的概念，有助于优化挖掘过程。具体到实现，作者选择了两个方向：一是寻找具有代表性的样本，二是发掘关键的条件属性。样本和属性的选择在这里起着关键作用，因为它们是挖掘过程中构建模型的基础。在MATLAB中，作者利用名为“CardiologyCategorical”的Excel文件中的源数据，将前200行作为训练样本，剩余的103行用于测试规则的有效性。在预处理阶段，作者特别提到了对字符型数据的处理，例如将性别属性"Male"和"Female"转换为数值1和2，以及将"chestpaintype"中的某些类别转换为数值，便于后续的计算机处理。这一步骤通过在Excel中直接操作得以完成，并且生成了lisanhua.xsl文件，这是MATLAB能够识别和处理的数据格式。该文档深入介绍了如何在MATLAB环境中运用粗糙集理论的属性约简方法进行数据挖掘，强调了数据预处理和样本选择在实际应用中的关键作用。通过这种实践，读者可以了解到如何有效地使用MATLAB工具处理数据并发现潜在的规律。

、不满足以上条件的话如果 B得到决策属性为 2。

>、不满足以上条件的话如果 B 得到决策属性为 !!。

<、不满足以上条件的话如果 B 得到决策属性为 2。

=、不满足以上条件的话得到决策属性为 2。

六、正确率及结果分析

正确率为 :#>E

结果分析：由于采用了两类约束方法，所以效果还可以。

七、程序如下页所示

5

EEEEE数据预处理程序EEEEEE

3 4 !"45E载入数据

EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE

F3@5E离散化第一列数据

?3@

?FB39CF):

F35

 ?FB3:CF)<

F35

 F35



F3@5

?3@

?F33

F35

 F35



F3@5

?3@

F3FA5



F3@5

?3@

?FB39CF)

F35

 ?FB3CF)

F35

 F35



F>3@>5

剩余10页未读，继续阅读

阿里matlab建模师

粉丝: 4339
资源: 2850

MATLAB实现数据挖掘：粗糙集与关联规则探讨

达摩老生精品：SIFT算法Matlab完整实现

MATLAB实现Chow与Campello算法结合的高效代码

GrTheory_图论算法_matlab项目源码详解

【老生谈算法】matlab实现数据降维PCA算法源码.docx

【老生谈算法】matlab实现Markov仿真程序源码.docx.zip

【老生谈算法】matlab实现数据降维PCA算法源码(1).docx

【老生谈算法】matlab实现isodata算法.docx

【老生谈算法】matlab实现Butterworth低通滤波算法.docx

【老生谈算法】matlab实现图像颜色畸变校正算法.docx

【老生谈算法】matlab实现数字图像锐化处理算法.docx

最新资源