监督学习与深度学习：构建预测模型的全面指南

监督学习深度学习

需积分: 9 5 浏览量更新于2024-08-09 收藏 918KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

监督学习与深度学习是机器学习领域中的核心部分，特别是在数据分析和预测任务中。本文档，"监督学习深度学习.pdf"，由CS229课程提供，主要探讨了监督学习的概念、方法和应用。监督学习的目标是通过给定一组数据点（特征x和对应的标签y）来训练模型，使其能够预测未知数据的输出。以下是文档中涉及的主要知识点： 1. **分类和回归概述**: - 监督学习分为两类：回归（如线性回归，预测连续值输出）和分类（如逻辑回归，支持向量机，朴素贝叶斯，预测离散类别）。这些模型的区别在于输出的性质和预测目标。 2. **模型类型与决策边界**: - 分类模型关注的是决策边界，它区分不同类别的数据。生成模型则尝试估计输入x和输出y之间的概率关系，如朴素贝叶斯。 3. **损失函数**: - 损失函数衡量模型预测值与真实值的差距，常用的有均方误差（MSE）、对数损失（如逻辑损失、铰链损失和交叉熵），它们衡量预测的准确性或偏差。 4. **成本函数**: - 成本函数（或称损失函数的平均值）是评估模型性能的关键，例如在线性回归中，成本函数可能就是平均平方误差。在深度学习中，优化目标通常是最小化成本函数，以找到最佳模型参数θ。 5. **假设和预测**: - 假设选择的模型形式（如线性模型hθ），模型根据输入x预测输出hθ(x)，如在逻辑回归中，预测概率是sigmoid函数的结果。 6. **符号和一般概念**: - 文档提供了符号解释和机器学习的基本概念，如概率估计、模型学习内容以及数据分布的考虑。通过阅读这篇文档，读者可以深入了解监督学习的基础理论，以及如何应用深度学习技术来构建复杂的预测模型。此外，文档还强调了选择合适的损失函数和优化算法对模型性能的重要性。对于希望在机器学习特别是深度学习领域进一步发展的专业人士，这份资料是一份有价值的参考资源。

资源详情

资源推荐

CS 229 – Machine Learning https://stanford.edu/~shervine

VIP Cheatsheet: Supervised Learning

Afshine Amidi and Shervine Amidi

October 27, 2018

翻译: Wang Hongnian. 由朱小虎, Chaoying Xue and Z 审阅

监监监督督督学学学习习习简简简介介介

给定一组数据点{x

(1)

, ..., x

(m)

} 和与其对应的输出{y

(1)

, ..., y

(m)

}，我们想要建立一个分类器，学习

如何从x 预测y。

r 预预预测测测类类类型型型 – 不同类型的预测模型总结如下表:

回回回归归归分分分类类类

输输输出出出连续类

例例例子子子线性回归 Logistic回归，SVM，朴素贝叶斯

r 型型型号号号类类类型型型 – 不同型号总结如下表:

判判判别别别模模模型型型生生生成成成模模模型型型

目目目标标标直接估计P (y|x) 估计P (x|y) 然后推导P (y|x)

所所所学学学内内内容容容决策边界数据的概率分布

例例例图图图

示示示例例例回归，SVMs GDA，朴素贝叶斯

符符符号号号和和和一一一般般般概概概念念念

r 假假假设设设 – 假设我们选择的模型是h

。对于给定的输入数据x

(i)

，模型预测输出是h

(i)

)。

r 损损损失失失函函函数数数 – 损失函数是一个L : (z,y) ∈ R × Y 7−→ L(z,y) ∈ R 的函数，其将真实数据值y 和其预

测值z 作为输入，输出它们的不同程度。常见的损失函数总结如下表：

最最最小小小二二二乘乘乘误误误差差差 Logistic损损损失失失铰铰铰链链链损损损失失失交交交叉叉叉熵熵熵

(y − z)

log(1 + exp(−yz)) max(0,1 − yz) −



y log(z) + (1 − y) log(1 − z)



线性回归 Logistic回归 SVM 神经网络

r 成成成本本本函函函数数数 – 成本函数J 通常用于评估模型的性能，使用损失函数L 定义如下：

J(θ) =

i=1

L(h

(i)

), y

(i)

)

r 梯梯梯度度度下下下降降降 – 记学习率为α ∈ R，梯度下降的更新规则使用学习率和成本函数J 表示如下：

θ ←− θ − α∇J(θ)

备注：随机梯度下降（SGD）是根据每个训练样本进行参数更新，而批量梯度下降是在一批训练样本

上进行更新。

r 似似似然然然 – 给定参数θ 的模型L(θ) 的似然性用于通过最大化似然性来找到最佳参数θ。在实践中，我

们使用更容易优化的对数似然`(θ) = log(L(θ))。我们有:

opt

= arg max

L(θ)

r 牛牛牛顿顿顿算算算法法法 – 牛顿算法是一种数值方法，目的是找到一个θ 使得`

(θ) = 0. 其更新规则如下：

θ ← θ −

(θ)

备注：多维泛化，也称为Newton-Raphson 方法，具有以下更新规则：

θ ← θ −



∇

`(θ)



−1

∇

`(θ)

Stanford University 1 Fall 2018

下载后可阅读完整内容，剩余3页未读，立即下载

qq_39555421

粉丝: 0
资源: 5

监督学习与深度学习：构建预测模型的全面指南

深度学习入门.pdf

基于协同半监督的深度学习图像分类算法.pdf

机器学习学习笔记.pdf

图解机器学习算法.pdf

python machine learning machine learning and deep learning with python.pdf

深入浅出神经网络与深度学习

吴恩达机器学习笔记 pdf

赵卫东机器学习电子版pdf

李航 统计学习方法 pdf csdn

机器学习-原理、算法与应用pdf

leeml-notes pdf

机器学习100天 pdf 中文版

机器学习及python应用陈强pdf

hands-on machine learning with scikit-learn, keras, and tensorflow pdf

数据湖治理中心-数据治理方法论(2021)(22页).pdf

基于数据的强化学习相关资料链接

pdf下载hands-on machine learning with scikit-learn, keras & tensorflow, 2nd

contrastive self-supervised learning pdf

mastering machine learning algorithms 2nd pdf

pytorch生成对抗网络编程 pdf

最新资源

李航统计学习方法 pdf csdn