主动学习与回归：Tommi S. Jaakkola的机器学习讲义

需积分: 9 140 浏览量更新于2024-07-28 1 收藏 119KB PDF 举报

"这份资源是来自Tommi S. Jaakkola在MIT AI Lab的机器学习讲座第四讲的PPT，主题涉及主动学习和回归。内容包括主动学习的概念、选择标准及示例，特别强调了线性和多项式函数类的应用。" 在机器学习领域，Tommi S. Jaakkola的这份PPT深入探讨了主动学习（Active Learning）及其与监督学习的关系。监督学习是机器学习的一个基础类型，它涉及到从未知的联合分布P(x,y)中抽样(input, output)对来训练模型。然而，主动学习则更进一步，允许我们选择输入实例，并从条件分布P(y|x)中获取对应的输出，这种方式能更高效地利用有限的标注数据。主动学习的核心价值在于，由于我们可以主动选择要学习的样本，因此往往只需要极少量的训练样例就能达到良好的学习效果，这对于那些获取标注数据成本高或者时间消耗大的情况尤为关键。但是，这也带来了一定的风险，即我们可能会过于关注不重要、罕见甚至无效的输入，这可能偏离学习的初衷，影响模型的泛化能力。在实施主动学习时，有三个关键步骤需要考虑： 1. 函数类（Function Class）：我们需要确定模型将要学习的函数类型。在这个PPT中，重点讨论了线性或多项式函数，这类函数通常易于理解和计算，而且在许多实际问题中表现出色。 2. 选择标准（Selection Criterion）：我们需要制定一个准则来决定哪些输入值得查询。这个标准可能基于不确定性、信息增益或其他指标，目标是最大化模型的学习效率。 3. 应用选择标准的方式：选择是按顺序还是批量进行查询。顺序查询可能更适合逐步优化模型，而批量查询则可能在一次性获取大量信息时更为有效。此外，PPT还可能会涵盖主动学习的具体示例，展示如何在实际问题中应用这些理论。通过这些讲解，读者可以更好地理解如何在有限的数据资源下，通过主动学习策略提高机器学习模型的性能。

Active learning

• Why active learning?

– we often need dramatically fewer training examples; the

time/cost of getting enough training examples may be

otherwise prohibitive

• Dangers of (this type of) active learning

– since we select the inputs, we may focus on inputs that

are unimportant, rare, or even invalid

Tommi Jaakkola, MIT AI Lab 4

剩余18页未读，继续阅读

zhaoliping_jian

粉丝: 1
资源: 2

主动学习与回归：Tommi S. Jaakkola的机器学习讲义

机器学习PPT

李宏毅 机器学习 PPT

重庆大学软件学院机器学习ppt

Mitchell《机器学习》ppt讲义

cs229吴恩达机器学习课件完整学习资料

台大基石ppt学习

吴恩达机器学习笔记.zip

新版课件清华大学机器学习深度学习课件.zip

各类计算机语言学习书籍推荐ppt

稀疏表示与字典学习算法相关的ppt学习资料

最新资源

李宏毅机器学习 PPT