"斯坦福大学机器学习讲义:零基础学习好书,动机与工具,监督学习"

需积分: 10 1 下载量 20 浏览量 更新于2024-01-12 收藏 1.94MB DOCX 举报
机器学习是一门研究如何使计算机具备学习能力的学科。在机器学习中,我们不再需要直接编程解决问题,而是通过对经验数据的学习,让计算机能够自动地提取出问题的规律和模式,从而达到解决问题的目的。 斯坦福大学的机器学习讲义是一本非常出色的学习资料,特别适合零基础的人学习。从讲义中可以学习到机器学习的基本概念、原理和应用工具。该讲义强调了机器学习的动机和应用,为读者提供了一个全面的学习框架。 讲义中首先介绍了机器学习的定义。Arthur Samuel在1959年提出的机器学习定义是:通过给计算机赋予学习能力,使其能够在不直接编程的情况下解决问题。其中举了Arthur本人开发的下棋程序作为例子,程序能够计算每一步下棋获胜的概率,并最终打败程序作者本人。这个例子使用了决策树思想,非常直观地说明了机器学习的概念。 另外,Tom Mitchell在1998年提出了另一个机器学习的定义。他认为,一个合理的学习问题应该包含三个要素:任务T、性能测量方法P和经验E。如果在经验E的影响下,计算机程序在任务T上的性能测量方法P得到了改进,那么就可以说该程序从经验E中学习了。讲义中也以下棋程序为例,说明了Tom Mitchell定义中的三个要素。程序通过不断和自己下棋的经历,从经验E中学习到了如何提高和人类选手对弈的胜率。 讲义还将机器学习分为了四个主要部分。第一个部分是有监督学习,它可以用来解决回归问题和分类问题。回归问题是指需要预测的变量是连续的,例如通过收集某地房屋价格和大小的统计数据,可以画出一条拟合曲线,从而可以通过房屋大小来估计价格。分类问题则是需要处理离散的变量,例如判断肿瘤是恶性还是良性。有监督学习即给出一个数据集,其中包含了正确的房屋价格和对应的大小或是肿瘤的各种特征,通过对这些数据进行学习,就可以建立一个模型,从而对未来的数据进行预测和分类。 除了有监督学习,讲义还介绍了无监督学习、半监督学习和强化学习。无监督学习是指给出的数据集中没有标签信息,只有输入数据。通过对数据的学习,可以发现其中隐藏的规律和结构。半监督学习则是介于有监督学习和无监督学习之间,其中一部分数据有标签信息,另一部分数据没有标签信息。强化学习则是通过建立一个智能体和环境之间的交互来进行学习,智能体通过试错的方式来优化其行为策略。 在学习机器学习的过程中,除了斯坦福大学的讲义,还可以使用许多其他优秀的学习资源。例如,Andrew Ng的《机器学习》课程是非常经典和受欢迎的学习资料,他通过一系列的视频讲座和编程练习,详细地介绍了机器学习的基本原理和实际应用。此外,还可以参考吴恩达的《深度学习》课程,了解深度学习和神经网络的相关知识。 总之,机器学习是一门充满挑战和发展潜力的学科,正因为其广泛的应用和重要的作用,所以学习机器学习能够为个人的职业发展和学术研究带来巨大的机会和潜力。通过斯坦福大学的讲义和其他优秀的学习资源,我们可以系统地学习机器学习的基本原理和方法,并将其应用于实际问题的解决中。