使用梯度下降法预测研究生录取：Udacity深度学习课程笔记

需积分: 0 95 浏览量更新于2024-08-05 收藏 791KB PDF 举报

"该资源是Udacity深度学习课程的一部分，主要讲解了使用平均梯度下降法实现预测的原理和步骤，包括平方平均误差函数、梯度下降的数学原理和编程实现，以及在多层感知器中的应用。课程中通过研究生学院录取数据的例子，展示了如何对类别特征进行编码和数值特征的标准化，以及如何使用梯度下降进行模型训练。" 在深度学习领域，预测模型的构建通常涉及优化算法，平均梯度下降法是其中之一。以下是关键知识点的详细解释： 1. **平方平均误差函数**：这是衡量模型预测与真实值之间差距的常用损失函数。对于每个样本，误差是预测值和实际值之差的平方，所有样本误差的平均值构成总损失。损失函数的最小化是模型训练的目标。 2. **梯度下降**：这是一种优化算法，用于找到损失函数的最小值。它通过计算损失函数关于模型参数的梯度（导数），并沿负梯度方向更新参数，逐步接近最小值。在每次迭代中，参数的更新量由学习率（η）和当前梯度决定。 3. **梯度下降的数学**：梯度是损失函数对每个参数的偏导数组成的向量，指向损失增加最快的方向。在实践中，往往使用批量梯度下降（Batch Gradient Descent）或随机梯度下降（Stochastic Gradient Descent）等变体，以提高训练效率。 4. **梯度下降的代码实现**：在编程中，需要计算损失函数对每个参数的梯度，然后按照梯度下降的更新规则更新参数。这通常涉及到反向传播算法，用于计算所有层的梯度。 5. **多层感知器**：多层感知器（MLP）是一种前馈神经网络，具有至少一个隐藏层，可以学习更复杂的非线性关系。在梯度下降中，每个神经元的权重都会通过反向传播得到更新。 6. **反向传播**：反向传播算法用于计算损失函数相对于网络中每个权重的梯度。它从输出层开始，通过链式法则逐层反向计算每个权重的梯度。 7. **实现一个反向传播**：在实际编程中，反向传播涉及到计算每个层的激活函数的导数，以及利用链式法则将这些导数传播回先前的层。这个过程用于更新网络中的权重。在实际应用中，数据预处理是非常重要的一步。例如，对于类别特征（如本科院校排名），需要用one-hot编码将它们转换为数值特征；对于数值特征（如GRE和GPA），则需要进行标准化，确保数据集中所有特征的均值为0，标准差为1，这样有助于梯度下降算法的收敛。本资源详细介绍了如何使用平均梯度下降法训练一个多层感知器模型，从理论到实践，包括数据预处理、模型构建、损失函数的选择、优化算法的应用以及反向传播的实现。这对于理解和应用深度学习模型至关重要。

2018/10/12 深度学习 - Udacity

https://classroom.udacity.com/nanodegrees/nd101-cn-advanced/parts/484efacf-1085-4481-9218-982074a4627c/modules/675d02b4-7881-4c86-8

…

1/6

实现梯度下降

现在我们知道了如何更新我们的权重：

你看到的是如何实现一次更新，那我们如何把

代码转化为能够计算多次权重更新，使得我们

的网络能够真正学习呢？

作为示例，我们拿一个研究生学院录取数据，

用梯度下降训练一个网络。数据可以在这里找

到。数据有三个输入特征：GRE 分数、GPA 分

数和本科院校排名（从 1 到 4）。排名 1 代表

最好，排名 4 代表最差。

Δw

= η ∗ δ

∗ x

ij j i

我们的目标是基于这些特征来预测一个学生能

否被研究生院录取。这里，我们将使用有一个

输出层的网络。用 sigmoid 做为激活函数。

数据清理

你也许认为有三个输入单元，但实际上我们要

先做数据转换。 rank 是类别特征，其中的数

字并不表示任何相对的值。排名第 2 并不是排

名第 1 的两倍；排名第 3 也不是排名第 2 的

实现梯度下降



课程 5:

实现梯度下降

搜索



课程资源

概念





1. 平方平均误差函数



2. 梯度下降



3. 梯度下降：数学



4. 梯度下降：代码



5. 实现梯度下降



6. 多层感知器



7. 反向传播



8. 实现一个反向传播



9. 进阶阅读





下载后可阅读完整内容，剩余5页未读，立即下载

简甜XIU09161027

粉丝: 32
资源: 310

使用梯度下降法预测研究生录取：Udacity深度学习课程笔记

udacity-deep-rl:Udacity深度强化学习课程

自动驾驶中MPC模型预测控制，是udacity中的开源项目。.zip

udacity-machine-learning-engineer:Udacity纳米级机器学习工程师的作业和笔记

Udacity-Deep-Learning-Assignment

Predicting-Bike-Sharing-Patterns:Udacity深度学习纳米学位的第一个项目

udacity-deep-learning:在PURE Python中使用TensorFlow进行Udacity深度学习类的作业，而不是IPython Notebook

udacity_deep_learning

Udacity 机器学习初级.zip

从Udacity进行AI编程的纳米学位-实验室解决方案：此存储库包含我针对使用python进行AI编程的Udacity纳米学位的测验和实验室的解决方案。

course_intro_to_machine_learning:Udacity课程“机器学习入门”-Python2

最新资源