30年探索：从弱到强的机器学习里程碑——Boosting理论之旅

需积分: 0 146 浏览量更新于2024-08-05 收藏 1.17MB PDF 举报

本文主要探讨了机器学习领域中一个里程碑式的理论问题——弱学习与强学习之间的等价性。1989年，由哈佛大学的莱斯利·维利昂特和迈克尔·肯斯提出的这一问题关注的是：是否存在一个理论基础，即使一个学习任务可以通过“弱学习算法”实现稍微优于随机猜测的结果，那么是否必然存在能够逼近理论上限的“强学习算法”。这个问题的背景是，虽然现实中的任务往往能轻松找到表现稍好于随机的算法，但提高到非常高的准确率却极其困难。 1990年，罗伯特·夏柏尔的突破性论文表明，这个问题的答案是肯定的。他的构造性证明展示了如何通过一系列“基学习器”的组合，使弱学习算法升级为强学习算法。这种方法的关键在于，后续的学习器会针对前者的弱点进行聚焦，以此不断提升整体性能。然而，夏柏尔的方法在实践中并不实用，因为它依赖于预先知道问题的最优解，这在实际应用中几乎是不可能的。夏柏尔后来与约夫·弗洛恩德合作，他们在1995年的欧洲计算学习理论会议上共同推进了这一理论。他们的工作最终催生了著名的Boosting算法，尤其是AdaBoost，这是一种迭代方法，通过不断调整权重和训练样本，使得模型能够集中在那些先前被忽略的重要特征上，从而显著提高整体预测能力。 AdaBoost的核心概念是间隔最大化，即通过最大化不同类别之间的决策边界来优化模型。这个理论不仅在理论上极具价值，而且在实际机器学习中产生了深远的影响，尤其是在数据不平衡和复杂问题处理上。它揭示了通过弱学习器的组合可以达到强大的学习效果，为后来的深度学习和其他强化学习技术奠定了基础。总结来说，这篇文章以一个富有启发性的故事形式，揭示了Boosting学习理论的发展历程，特别是从弱学习到强学习的理论跨越，以及AdaBoost算法如何在这一过程中扮演关键角色。这一理论探索不仅推动了机器学习领域的理论发展，也为算法工程师提供了重要的设计指导。

专栏

第 16 卷第 4 期 2020 年 4 月　

这篇文章尝试用通俗故事的方式讲述一个机器

学习理论中重要问题的探索历程。读者或能从中感

受到机器学习理论探索的曲折艰辛，体会到理论进

展对算法设计的指引意义。

溯源

1989 年，哈佛大学的莱斯利

维利昂特（Leslie

Valiant，计算学习理论奠基人、2010 年 ACM 图灵奖

得主）和他的学生迈克尔

肯斯（Michael Kearns，后

来担任贝尔实验室人工智能研究部主任）提出了一个

公开问题：“弱可学习性是否等价于强可学习性？”

这个问题大致上是说：如果一个机器学习任务

存在着比“随机猜测”略好一点的“弱学习算法”，

那么是否就必然存在着准确率任意高（与该问题的

理论上限任意接近）的“强学习算法”？

直觉上这个问题的答案大概是“否定”的，因

为我们在现实任务中通常很容易找到比随机猜测稍

好一点的算法（比方说准确率达到 51%）、却很难

找到准确率很高的算法（比方说达到 95%）。

出人意料的是，1990 年，麻省理工学院的

罗伯特

夏柏尔(Robert Schapire) 在著名期刊

Machine Learning

上发表论文，证明这个问题的答案

是“ YES”！更令人惊讶的是，他的证明是构造性的！

也就是说，夏柏尔给出了一个过程，直接按这

个过程进行操作就能将弱学习算法提升成强学习算

法。过程的要点是考虑一系列“基学习器”，让“后

来者”重点关注“先行者”容易出错的部分，然后

再将这些基学习器结合起来。

遗憾的是，这个过程仅具备理论意义，并非一

个能付诸实践的实用算法，因为它要求知道一些实

践中难以事先得知的信息，比方说在解决一个问题

之前，先要知道这个问题的最优解有多好。

后来夏柏尔到了新泽西的贝尔实验室工作，在

这里遇见加州大学圣塔克鲁兹分校毕业的约夫

弗洛恩德 (Yoav Freund)。凑巧的是，弗洛恩德曾经

研究过多学习器的结合。两人开始合作。终于，他

们在 1995 年欧洲计算学习理论会议（注：该会议

周志华

南京大学

Boosting 学习理论的探索

——一个跨越 30 年的故事

关键词：

机器学习　AdaBoost 间隔理论　Boosting 学习理论

图 1 时任 ACM 主席戴维

帕特森（David Patterson，

右一）和首席运营官约翰

怀特（John White，

右四）向夏柏尔（右三）和弗洛恩德（右二）

颁发“ ACM 帕里斯

卡内拉基斯理论与实践奖”

下载后可阅读完整内容，剩余6页未读，立即下载

傅融

粉丝: 31
资源: 333

30年探索：从弱到强的机器学习里程碑——Boosting理论之旅

集成学习Boosting算法综述.docx

用图文解释boosting算法理论原理

Boosting集成学习和非集成学习的区别

集成学习boosting算法

集成学习bagging和boosting

boosting的基学习器也是决策树吗

python集成学习boosting可视化

介绍Boosting的基本思想，比较Boosting和Bagging的异同。、

boosting和bagging的区别

bagging和boosting算法

最新资源