机器学习:关联分析与相关性度量

需积分: 31 10 下载量 160 浏览量 更新于2024-08-21 收藏 3.28MB PPT 举报
本课件围绕"由关联分析到相关分析"的主题,深入探讨了机器学习中的一个重要概念——度量事件间的相关性和依赖性。关联分析是通过计算两个事件同时发生的概率(P(A∩B))与它们各自独立发生概率的乘积(P(A)P(B))的比例来评估它们之间的关系。相关系数corrA,B的值可以揭示出A与B之间的关系性质: - 当corrA,B = 1时,表示A与B相互独立,因为它们同时出现的概率等于各自概率的乘积; - corrA,B > 1意味着A与B呈正相关,即一个事件更可能伴随着另一个事件的发生; - corrA,B < 1则表明A与B呈负相关,即一个事件出现会减少另一个事件出现的可能性。 举个例子,通过计算录像带和游戏的交叉熵(P({game,video})/(P({game})×P({video}))),得到的结果为0.89,这显示两者之间存在负相关关系,即购买录像带的人可能不太倾向于购买游戏。 课程内容还包括监督学习的基础概念,如分类、回归、密度估计、非参数方法(如决策树和人工神经网络)、贝叶斯学习以及强化学习等,这些都是机器学习的核心组成部分。此外,课程强调理解和实践的重要性,要求学生掌握基本概念,理解方法思想,能够实现少数经典算法,并鼓励课堂互动和思考。 大连海事大学的信息科学与技术学院提供本课程,采用多种方式考核学生的学习效果,包括平时成绩、点名、上机作业和期末考试。教材推荐使用《机器学习》和《机器学习导论》两本书。课程总共54学时,包含理论授课和上机实践环节,辅导答疑时间固定在每周四中午。 机器学习的应用广泛,如在大型数据库中挖掘数据(数据挖掘),可以帮助企业洞察消费者行为,预测趋势,优化业务决策。它不仅能用于商业智能,还涉及自动驾驶、医疗诊断、自然语言处理等多个领域,展示了其在未来科技发展中的核心地位。学习这门课程旨在为深入研究和实际工作奠定坚实的基础。