机器学习与数据挖掘:关联分析在经验积累中的作用

需积分: 13 16 下载量 94 浏览量 更新于2024-08-15 收藏 509KB PPT 举报
"关联分析-机器学习与数据挖掘" 在数据挖掘和机器学习领域,关联分析是一种重要的技术,它主要用于发现数据集中不同项目之间的有趣关系。关联分析的目标是找到那些频繁一起出现的“属性—值”对,即所谓的关联规则。这些规则能够揭示在特定条件下,某些事件或特征倾向于共同发生。例如,描述中给出的实例,年龄在20到29岁且收入在20K到29K的人群购买CD播放器的概率为60%,支持度为2%,这意味着在所有观察到的交易中有2%同时满足这两个条件并购买了CD播放器。另一个例子是购买尿布(Diaper)与购买啤酒(Beer)之间的关联,虽然发生的频率低(0.5%),但一旦购买尿布,购买啤酒的可能性高达75%。 机器学习是一门研究如何让计算机系统通过经验学习和改善其性能的学科。这一概念起源于心理学对学习的解释,即个体通过经历改变行为的过程。在计算机科学中,Tom M. Mitchell给出了一个被广泛接受的定义:如果一个程序在完成特定任务(T)时,其性能(P)随着经验(E)的增加而提升,那么该程序就从经验E中学习。 机器学习系统通常由四个基本部分构成:环境、知识库、学习环节和执行环节。环境是系统获取信息的来源,可以是系统所处的实际情境,如病人症状或待识别的图像。知识库存储系统已学习到的知识,而学习环节负责处理环境信息,通过比较和分析来更新知识库。执行环节则依据知识库中的信息执行任务,并将执行结果反馈给学习环节,形成一个闭环的学习过程。 知识库的形式和内容是设计机器学习系统的关键考虑因素,因为它决定了知识的表达能力、推理效率以及适应性。常见的知识表示方法有:一阶谓词逻辑、产生式规则、框架、语义网络、类和对象、模糊集合、贝叶斯网络、脚本、过程等。每种方法都有其优缺点,选择时应考虑其在表达复杂性、推理效率、易修改性和扩展性等方面的特性。 关联分析是数据挖掘中发现隐藏模式的工具,而机器学习是让计算机系统通过经验学习和改进性能的方法。这两者结合,可以帮助我们从大量数据中提取有价值的洞察,以支持决策和预测。在实际应用中,比如推荐系统、市场篮子分析等,关联规则和机器学习都发挥着关键作用。