机器学习基石：Generalization理论探索

需积分: 0 135 浏览量更新于2024-08-05 收藏 1.09MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"林轩田《机器学习基石》课程笔记6深入探讨了机器学习的泛化能力和成长函数，特别是关于2D perceptrons的成长函数的多项式级别猜想。笔记介绍了成长函数与breakpoint的关系，并引入bounding function来简化问题，旨在证明成长函数的上界是多项式的，以支持机器学习的可行性。" 在机器学习中，泛化能力是模型在未见过的数据上的表现，这是评价模型好坏的关键指标。当模型复杂度过高（如M过大），可能会导致过拟合，降低泛化能力。因此，限制模型复杂度变得至关重要。在本课程笔记中，林轩田教授探讨了如何通过限制breakpoint来控制模型复杂度，即成长函数。成长函数\( M(d, N) \)描述了一个模型类别在d维空间中能分类的最多样本数N的不同方式。Breakpoint k是一个关键概念，它代表模型可以正确分类的最大线性不交子集的大小。例如，在2D perceptrons中，breakpoint k表示模型可以区分的最大线性区域的数量。若N大于k，breakpoint限制了成长函数的值，因为它定义了数据集能被分类的方式的最大数量。笔记进一步引出了bounding function \( B(N, k) \)，它是成长函数\( M(d, N) \)的上界，表示当breakpoint为k时，成长函数可能达到的最大值。bounding function的作用在于简化问题，不论模型是处理1D positive intervals还是2D perceptrons，我们只需关注成长函数的上限，从而可以更专注于证明成长函数是多项式的。对于bounding function的计算，笔记指出了一些基本情况： 1. 当k=1时，由于每个点只能被分为一类，所以\( B(N, 1) \)恒为1。 2. 当N<k时，由于breakpoint定义，模型无法shatter所有N个点，所以成长函数\( M(d, N) \)为0。 3. 当N=k时，此时模型刚好能区分所有N个点，但不能更多，所以\( M(d, N) \)等于所有可能的线性分割数量。证明bounding function \( B(N, k) \)是多项式级别的，结合霍夫丁不等式，可以用来替换M，从而保证机器学习的可行性，即使在有限的训练样本下，模型也能有效地泛化到新数据。通过这样的理论分析，林轩田教授的课程笔记帮助我们理解如何在实际应用中控制模型的复杂度，提高泛化能力，这对于构建稳健的机器学习系统具有重要意义。通过限制breakpoint和理解bounding function，我们可以更好地设计和选择模型，以在有限数据下实现最优的泛化性能。

资源详情

资源推荐

作者：红色石头公众号：AI有道（id：redstonewill）



上一节课，我们主要探讨了当M的数值大小对机器学习的影响。如果M很大，那么就

不能保证机器学习有很好的泛化能力，所以问题转换为验证M有限，即最好是按照多

项式成长。然后通过引入了成长函数和dichotomy以及breakpoint的概念，提

出2Dperceptrons的成长函数是多项式级别的猜想。这就是本节课将要深入

探讨和证明的内容。

我们先回顾一下上节课的内容，四种成长函数与breakpoint的关系：





下面引入一个例子，如果k=2，那么当N取不同值的时候，计算其成长函数是

多少。很明显，当N=1时， =2,；当N=2时，由breakpoint为2可知，任意两

点都不能被shattered（shatter的意思是对N个点，能够分解为种dichotomies）；

最大值只能是3；当N=3时，简单绘图分析可得其，即最多只有

4种dichotomies。



林轩田《机器学习基石》课程笔记6Theoryof

Generalization

一、RestrictionofBreakPoint

下载后可阅读完整内容，剩余9页未读，立即下载

杏花朵朵

粉丝: 21
资源: 332

机器学习基石：Generalization理论探索

清华大学崔鹏等最新「分布外泛化(Out-Of-Distribution Generalization)」 综述论文

工程数据分析方法11-theory of generalization-20230426.pdf

Generalization in Machine Learning via Analytical Learning Theory.pdf

zero-shot generalization

towards out of distribution generalization: a survey

Some of the most difficult problems that AI has to solve

Improving Generalization Performance by Switching from Adam to SGD

domain generalization 和 transfer learning

generalization gap是什么意思

domain generalization

gis generalization

limit of GoogLeNet

计算泰勒窗。泰勒加权函数

最新资源

清华大学崔鹏等最新「分布外泛化(Out-Of-Distribution Generalization)」综述论文