机器学习入门:定义与监督学习分类解析

需积分: 11 0 下载量 164 浏览量 更新于2024-08-04 收藏 2.22MB PDF 举报
"这是一份关于机器学习的初步学习笔记,涵盖了第一章的前两节,主要讨论了机器学习的基本概念和分类。笔记中探讨了如何赋予计算机非显著式编程的能力,即让计算机自我学习和总结规律,同时也提到了机器学习的两种主要类型:监督学习和强化学习。此外,还举例解释了这两个学习类型的实例,并简要介绍了监督学习的几个子类别,包括传统的监督学习、非监督学习和半监督学习。" 正文: 机器学习是现代计算机科学中的一个重要领域,它致力于研究如何使计算机系统通过经验学习和改进。在第一章的第一节中,笔记首先给出了机器学习的两个定义。第一个定义强调了机器学习的核心——让计算机在没有明确编程的情况下,自行发现规律。这种非显著式编程方式允许计算机自我学习,例如,通过分析大量的菊花和玫瑰图片,计算机可以自动识别出区分两者的关键特征。 第二个定义则更加量化,它将机器学习视为一个根据经验E(如训练样本)优化性能指标P(如准确率)的过程,这通常涉及最优化理论的应用。笔记列举了几个机器学习的实际应用示例,包括自动下棋、垃圾邮件过滤、人脸识别和自动驾驶,这些都展示了机器学习在不同场景下的实际作用。 接下来,笔记介绍了机器学习的主要分类。监督学习是其中的一种,它需要人为地为每个训练样本提供标签,比如在图像识别任务中,人为标注图像内容是花朵还是动物。这种学习方式在许多实际应用中非常常见,如支持向量机、人工神经网络和深度神经网络等算法都是监督学习的代表。 强化学习则更注重计算机与环境的交互,通过不断尝试和反馈,优化其行为策略以获得最大奖励。在这种学习模式下,计算机并不一定预先知道正确的答案,而是通过实验和试错逐渐提升表现。 此外,笔记还提及了监督学习的几个子类别。传统的监督学习处理的是带有标签的训练数据;非监督学习则在无标签数据中寻找结构和模式;而半监督学习介于两者之间,训练数据部分有标签,部分没有。由于获取带标签的数据成本高昂,半监督学习成为了一种重要的研究方向。 最后,笔记指出分类和回归这两种机器学习任务之间的界限并不绝对,它们可以根据需求相互转化。这意味着一个原本用于分类问题的模型,经过适当的调整,也可以应用于回归问题的解决。 这份笔记为初学者提供了机器学习的基础概念和关键分类,是入门这一领域的良好起点。