深度学习实战Gluon：从线性回归到DenseNet

需积分: 0 186 浏览量更新于2024-06-30 收藏 28.23MB PDF 举报

"该资源是一份基于MXNet框架的深度学习教程，名为‘gluon_tutorials_zh’，涵盖了从基础到进阶的多种深度学习模型和概念，包括正向传播、反向传播、Kaggle实战、DenseNet等。教程旨在帮助读者掌握MXNet的Gluon接口，适用于初学者和有一定经验的学习者。" 本教程详细介绍了深度学习的基本概念和技术，以下是其中的一些关键知识点： 1. **正向传播和反向传播**：正向传播是神经网络模型预测过程，输入数据通过网络的各层，计算每个节点的激活值，直至得到输出。反向传播则是计算损失函数相对于每个参数的梯度，用于更新网络权重，这是训练过程的核心部分。 2. **Kaggle实战**：Kaggle是一个著名的数据科学竞赛平台，教程中的实战部分指导读者如何使用Gluon预测房价，同时讲解了K折交叉验证技术，这是一种评估模型性能的常用方法，通过将数据集分成K个子集，每次用K-1个子集训练模型，剩下的子集用于验证，重复K次并取平均结果。 3. **Gluon基础**：Gluon是MXNet提供的高级API，它提供了更加灵活和直观的方式来构建神经网络。教程涵盖了创建网络、初始化模型参数、序列化模型、设计自定义层以及在GPU上进行计算等内容。 4. **卷积神经网络(CNN)**：CNN在图像识别和处理中扮演重要角色。教程从零开始解释CNN的构建，并介绍了Gluon中实现CNN的方法。此外，还涉及了批量归一化、深度CNN如AlexNet、VGG、GoogLeNet、ResNet以及DenseNet（稠密连接的卷积神经网络），DenseNet通过每个层都连接到所有后续层，提高了信息传递效率。 5. **循环神经网络(RNN)**：RNN用于处理序列数据，如文本和时间序列数据。教程包括了从零开始构建RNN，以及更复杂的门控循环单元（GRU）和长短期记忆（LSTM）模型，这些模型解决了标准RNN的梯度消失问题。 6. **优化算法**：优化算法是训练神经网络的关键，教程涵盖了梯度下降、随机梯度下降等基本方法，并在Gluon中应用这些算法进行模型训练。通过这个教程，读者将能够深入理解深度学习的基本原理，掌握MXNet和Gluon的使用，以及如何应用于实际问题，如房价预测和图像识别。此外，还能了解到各种先进的网络结构和优化技巧，为进一步研究深度学习提供坚实的基础。

动⼿学深度学习, 0.6

1.3.6 概率和统计

P(·)：概率分布

· ∼ P：随机变量 · 的概率分布是 P

P(· | ·)：条件概率分布

(f(·))：函数 f(·) 对 · 的数学期望

1.3.7 复杂度

O：⼤ O 符号（渐进符号）

10 1. 前⾔

动⼿学深度学习, 0.6

⼀个程序来回应唤醒词，例如“Okay, Google”，“Siri”，和“Alexa”。如果在⼀个只有你⾃⼰和

代码编辑器的房间⾥，仅使⽤最基本的指令编写这个程序，你该怎么做？不妨思考⼀下……这个问

题⾮常困难。你可能会想像下⾯的程序：

if input_command == 'Okey, Google':

run_voice_assistant()

但实际上，你能拿到的只有麦克⻛⾥采集到的原始语⾳信号，可能是每秒 44,000 个样本点。怎样

的规则才能把这些样本点转成⼀个字符串呢？或者简单点，判断这些信号中是否包含唤醒词。

如果你被这个问题难住了，不⽤担⼼。这就是我们为什么需要机器学习。

虽然我们不知道怎么告诉机器去把语⾳信号转成对应的字符串，但我们⾃⼰可以。换句话说，就算

你不清楚怎么编写程序，好让机器识别出唤醒词“Alexa”，你⾃⼰完全能够识别出“Alexa”这个

词。由此，我们可以收集⼀个巨⼤的数据集（data set），⾥⾯包含了⼤量语⾳信号，以及每个语

⾳型号是否对应我们需要的唤醒词。使⽤机器学习的解决⽅式，我们并⾮直接设计⼀个系统去准确

地辨别唤醒词，而是写⼀个灵活的程序，并带有⼤量的参数（parameters）。通过调整这些参数，

我们能够改变程序的⾏为。我们将这样的程序称为模型（models）。总体上看，我们的模型仅仅是

⼀个机器，通过某种⽅式，将输⼊转换为输出。在上⾯的例⼦中，这个模型的输⼊（input）是⼀

段语⾳信号，它的输出则是⼀个回答 {yes, no}，告诉我们这段语⾳信号是否包含了唤醒词。

如果我们选择了正确的模型，必然有⼀组参数设定，每当它听⻅“Alexa”时，都能触发 yes 的回

答；也会有另⼀组参数，针对“Apricot”触发 yes。我们希望这个模型既可以辨别“Alexa”，也

可以辨别“Apricot”，因为它们是类似的任务。不过，如果是本质上完全不同的输⼊和输出，⽐如

输⼊图⽚，输出⽂本；或者输⼊英⽂，输出中⽂，这时我们则需要另⼀个的模型来完成这些转换。

这时候你⼤概能猜到了，如果我们随机地设定这些参数，模型可能⽆法辨别“Alexa”，“Apricot”，

甚⾄任何英⽂单词。在而⼤多数的深度学习中，学习（learning）就是指在训练过程（training

period）中更新模型的⾏为（通过调整参数）。

换⾔之，我们需要⽤数据训练机器学习模型，其过程通常如下：

12 2. 预备知识

剩余489页未读，继续阅读

深层动力

粉丝: 24
资源: 318

深度学习实战Gluon：从线性回归到DenseNet

gluon_Tutorial

MXNet_gluon中文教程

gluon_tutorials_zh.pdf

import numpy as np import pandas as pd from mxnet import autograd, init, gluon, nd import mxnet from mxnet.gluon import nn from mxnet.gluon import data as gdata from mxnet.gluon import loss as gloss 代码讲解

ModuleNotFoundError Traceback (most recent call last) Cell In[2], line 1 ----> 1 from mxnet import autograd, nd, gluon, init 2 from mxnet.gluon import loss as gloss 3 from mxnet.gluon import data as gdata ModuleNotFoundError: No module named 'mxnet' 怎么解决

mxnet gluon环境配置

mxnet.gluon中的model_zoo能否用于导入已经下载到本地的预训练模型

numpy转化为mxnet.gluon.data

gluon6l3模型

transformer代码在哪找

最新资源