机器学习中的梯度下降算法详解

135 浏览量更新于2024-08-04 1 收藏 390KB PDF 举报

"这篇文档详细介绍了梯度下降算法在机器学习中的原理和应用。文档从一个下山的场景出发，类比解释了梯度下降如何帮助找到目标函数的最小值。主要内容包括概述、梯度下降算法的场景假设、数学解释、实例以及代码实现。" 梯度下降算法是机器学习中的一种基本优化方法，它广泛应用于线性回归、逻辑回归等模型的训练，用于求解损失函数的最小值。该算法的核心思想是通过迭代更新参数，逐步逼近函数的全局或局部最小值。 1. 概述梯度下降是通过不断调整模型参数，使得目标函数（如损失函数）逐步减小，最终达到最小值的过程。在这个过程中，每次参数更新的方向是由目标函数的梯度决定的，梯度指向函数值增加最快的方向。 2. 场景假设假设一个人在山上寻找下山的路径，由于大雾无法看清全局，只能依据当前位置的斜率判断下一步的方向。在机器学习中，这个“下山”过程就是沿着目标函数梯度的反方向移动，以达到最小值。 3. 数学解释 - α（学习率）：在每一步的更新中，α决定了沿着梯度方向移动的距离，过大可能导致未收敛或跳过最小值，过小则可能导致收敛速度慢。 - 梯度乘以负号：因为我们要沿着梯度的反方向移动，以使目标函数值下降，所以需要将梯度取反。 4. 实例 - 单变量函数的梯度下降：在只有一维参数的情况下，计算梯度即为函数的一阶导数，然后根据导数的正负来确定下降或上升。 - 多变量函数的梯度下降：对于多维度的参数，梯度是一个向量，包含了每个参数的方向导数，更新时沿着梯度向量的反方向进行。 5. 代码实现在实际应用中，需要编写代码来实现梯度下降算法，包括初始化参数、计算梯度、更新参数等步骤。通常会涉及到场景分析，例如选择合适的学习率和迭代次数。通过理解梯度下降的基本原理和实现方式，我们可以更好地应用它来优化模型的性能，特别是在大规模数据集和复杂模型的训练中，梯度下降是不可或缺的工具。此外，还有批量梯度下降、随机梯度下降和动量梯度下降等变种，它们在不同的情况下有不同的优势。

2.2.2 梯度梯度

梯度实际上就是多变量微分的一般化。

下面这个例子：

我们可以看到，梯度就是分别对每个变量进行微分，然后用逗号分割开，梯度是用<>包括起来，说明梯度其实一个向

量。

梯度是微积分中一个很重要的概念，之前提到过梯度的意义

在单变量的函数中，梯度其实就是函数的微分，代表着函数在某个给定点的切线的斜率

在多变量函数中，梯度是一个向量，向量有方向，梯度的方向就指出了函数在给定点的上升最快的方向在多变量函数中，梯度是一个向量，向量有方向，梯度的方向就指出了函数在给定点的上升最快的方向

这也就说明了为什么我们需要千方百计的求取梯度！我们需要到达山底，就需要在每一步观测到此时最陡峭的地方，梯

度就恰巧告诉了我们这个方向。梯度的方向是函数在给定点上升最快的方向，那么梯度的反方向就是函数在给定点梯度的方向是函数在给定点上升最快的方向，那么梯度的反方向就是函数在给定点

下降最快的方向，这正是我们所需要的下降最快的方向，这正是我们所需要的。所以我们只要沿着梯度的方向一直走，就能走到局部的最低点！

2.3 数学解释数学解释

首先给出数学公式：

此公式的意义是：J是关于Θ的一个函数，我们当前所处的位置为Θ0点，要从这个点走到J的最小值点，也就是山底。首

先我们先确定前进的方向，也就是梯度的反向，然后走一段距离的步长，也就是α，走完这个段步长，就到达了Θ1这个

点！

2.3.1 α

α在梯度下降算法中被称作为学习率或者步长，意味着我们可以通过α来控制每一步走的距离，以保证不要步子跨的太大

扯着蛋，哈哈，其实就是不要走太快，错过了最低点。同时也要保证不要走的太慢，导致太阳下山了，还没有走到山

下。所以α的选择在梯度下降法中往往是很重要的！α不能太大也不能太小，太小的话，可能导致迟迟走不到最低点，太

大的话，会导致错过最低点！

(−2y +

∂y

∂

z ) =

−10y

(5θ +

∂θ

∂

2θ −

12θ ) =

(0.55 −

∂θ

∂

(5θ +

2θ −

12θ )) =

−2

J(Θ) = 0.55 − (5θ +

2θ −

12θ )

▽J(Θ) = , , =⟨

∂θ

∂J

∂θ

∂J

∂θ

∂J

⟩ (−5, −2, 12)

Θ =

Θ +

α▽J(Θ) → evaluatedatΘ

剩余10页未读，继续阅读

快乐无限出发

粉丝: 1208
资源: 7395

机器学习中的梯度下降算法详解

斯坦福机器学习课程资料深度解析

机器学习课程个人笔记带页码完整版

Numpy机器学习框架搭建教程：华为软挑2020

回归算法讲解--.pdf

深度学习作业quiz-已完成.pdf

Computer Vision - Linda Shapiro.pdf

PDF-MachineLearningInAction-英文版.rar

机器学习算法知识手册.pdf.rar

图解机器学习算法.pdf

动手学深度学习（2019-05-21）.rar

最新资源