Gluon实现深度学习基础：多层感知机与优化技术

需积分: 0 21 浏览量更新于2024-07-01 收藏 16.55MB PDF 举报

"动手学深度学习1"是一本实用教程，专注于介绍深度学习的基本概念和实践应用，特别是使用MXNet库进行编程实现。章节内容涵盖了深度学习的核心组件和技术，如多层感知机（MLP）、Softmax回归、卷积神经网络（CNN）、循环神经网络（RNN）以及相关的模型优化方法。第3章深入介绍了多层感知机（MLP），包括从零开始的实现和利用Gluon API的实现，这对于理解神经网络的结构和工作原理至关重要。这部分涵盖了模型的构建，包括正向传播、反向传播和使用计算图进行高效的计算。同时，还讨论了如何选择合适的模型、防止过拟合问题，如通过权重衰减和丢弃法来提升模型的泛化能力。接下来的章节转向更复杂的计算架构，如卷积神经网络，详细讲解了二维卷积层、填充和步幅、多输入通道和输出通道等核心概念，以及各种经典的网络结构如LeNet、AlexNet、VGG、NiN、GoogLeNet、ResNet和DenseNet。这些网络在图像识别任务中扮演着关键角色。循环神经网络部分介绍了语言模型、RNN的基本原理，以及如何用Gluon实现。通过周杰伦专辑歌词的数据集，读者可以实践如何处理序列数据和时间序列分析。此外，书中还涉及了模型构造、参数管理、GPU加速以及深度学习计算中的关键技巧，如模型参数的访问、初始化、延迟初始化和自定义层的创建。作者通过实战Kaggle比赛——房价预测，让读者将所学知识应用到实际场景中，加深理解。 "动手学深度学习1"是一本非常适合初学者和有一定经验的开发者深入了解深度学习理论和实践操作的教材，通过丰富的实例和代码示例，帮助读者逐步掌握深度学习的基础和进阶技能。

度学习模型也可以看作是由许多简单函数复合而成的函数。当这些复合的函数⾜够多时，深度学

习模型可以表达⾮常复杂的变换。

深度学习可以逐级表⽰越来越抽象的概念或模式。以图像为例，它的输⼊是⼀堆原始像素值。深

度学习模型中，图像可以逐级表⽰为特定位置和⻆度的边缘、由边缘组合得出的花纹、由多种花

纹进⼀步汇合得到的特定部位的模式等。最终，模型能够较容易根据更⾼级的表⽰完成给定的任

务，例如识别图像中的物体。值得⼀提的是，作为表征学习的⼀种，深度学习将⾃动找出每⼀级

表⽰数据的合适⽅式。

因此，深度学习的⼀个外在特点是端到端的训练。也就是说，并不是将单独调试的部分拼凑起来

组成⼀个系统，而是将整个系统组建好之后⼀起训练。⽐如说，计算机视觉科学家们之前曾⼀度

将特征构造与机器学习模型的构建分开处理，像是 Canny 边缘探测 [20] 和 SIFT 特征提取 [21] 曾

占据统治性地位达 10 年以上，但这也就是⼈类能找到的最好⽅法了。当深度学习进⼊这个领域，

这些特征提取⽅法就被性能更强的⾃动优化的逐级滤波器替代了。

相似地，在⾃然语⾔处理领域，词袋模型多年来都被认为是不⼆之选 [22]。词袋模型是将⼀个句

⼦映射到⼀个词频向量的模型，但这样的做法完全忽视了单词的排列顺序或者是句中的标点符

号。不幸的是，我们也没有能⼒来⼿⼯构建更好的特征。但是⾃动化的算法反而可以从所有可能

的特征设计中搜寻最好的那个，这也带来了极⼤的进步。例如，语义相关的词嵌⼊能够在向量空

间中完成如下推理：“柏林 - 德国 + 中国 = 北京”。可以看出，这些都是端到端训练整个系统带来

的效果。

除了端到端的训练以外，我们也正在经历从含参数统计描述转向完全⽆参数的模型。当数据⾮常

稀缺时，我们需要通过简化对现实的假设来得到实⽤的模型。当数据充⾜时，我们就可以⽤能更

好地拟合现实的⽆参数模型来替代这些含参数模型。这也使得我们可以得到更精确的模型，尽管

需要牺牲⼀些可解释性。

深度学习的另⼀个与此前⼯作的区别是对于⾮最优解的包容、⾮凸⾮线性优化的使⽤以及勇于尝

试没有被证明过的⽅法。这种在处理统计问题上的新经验主义⻛潮与⼤量⼈才的涌⼊，带来了在

实际问题上的⾼速进展，尽管⼤部分情况下需要修改甚⾄重新发明已经存在数⼗年的⼯具。

最后，深度学习社区⻓期以来以在学界和企业之间分享⼯具而⾃豪，并开源了许多优秀的软件库、

统计模型和预训练⽹络。正是本着开放开源的精神，本书和基于它的教学视频可以⾃由下载和随

意分享。我们致⼒于为所有⼈降低学习深度学习的⻔槛，并希望⼤家从中获益。

10 1. 引⾔

1.3.1 ⾯向的读者

本书⾯向希望了解深度学习，特别是对实际使⽤深度学习感兴趣的⼤学⽣、⼯程师和研究⼈员。

本书并不要求你有任何深度学习或者机器学习的背景知识，我们将从头开始解释每⼀个概念。虽

然深度学习技术与应⽤的阐述涉及了数学和编程，但你只需了解基础的数学和编程，例如基础

的线性代数、微分和概率，以及基础的 Python 编程。在附录中我们提供了本书所涉及的主要数

学知识供你参考。如果你之前没有接触过 Python，可以参考中⽂教程 http://www.runoob.com/

python/python-tutorial.html 或英⽂教程 http://learnpython.org/ 。当然，如果你只对本书中的

数学部分感兴趣，你可以忽略掉编程部分，反之亦然。

1.3.2 内容和结构

本书内容⼤体可以分为三部分：

• 第⼀部分（第 1 章⾄第 3 章）涵盖预备⼯作和基础知识。第 1 章介绍了深度学习的背景和本

书的使⽤⽅法。第 2 章提供了动⼿学深度学习所需要的预备知识，例如如何获取并运⾏书

中的代码。第 3 章包括了深度学习最基础的概念和技术，例如多层感知机和模型正则化。如

果你时间有限，并且只希望了解深度学习最基础的概念和技术，那么你只需阅读第⼀部分。

• 第⼆部分（第 4 章⾄第 6 章）关注现代深度学习技术。第 4 章描述了深度学习计算的各个

重要组成部分，并为之后实现更复杂的模型打下基础。第 5 章解释了近年来令深度学习在

计算机视觉领域⼤获成功的卷积神经⽹络。第 6 章阐述了近年来常⽤于处理序列数据的循

环神经⽹络。阅读第⼆部分有助于掌握现代深度学习技术。

• 第三部分（第 7 章⾄第 10 章）讨论计算性能和应⽤。第 7 章评价了各种⽤来训练深度学习

模型的优化算法。第 8 章检验了影响深度学习计算性能的⼏个重要因素。第 9 章和第 10 章

分别列举了深度学习在计算机视觉和⾃然语⾔处理中的重要应⽤。这部分内容可供你根据

兴趣选择阅读。

图 1.2 描绘了本书的结构。

14 1. 引⾔

剩余525页未读，继续阅读

小明斗

粉丝: 38
资源: 329

Gluon实现深度学习基础：多层感知机与优化技术

动手深度学习1

动手学深度学习 by 阿斯顿·张（Aston Zhang） 李沐（Mu Li） [美] 扎卡里·C1

李沐《动手学习深度学习》

动手学深度学习 v2 pdf

动手学深度学习v2下载

动手学习深度学习2022版pdf

动手学深度学习2 pdf

动手学深度学习pytorch

动手学深度学习 pytorch.pdf csnd

动手学深度学习和深度学习两本书的区别

最新资源

动手学深度学习 by 阿斯顿·张（Aston Zhang）李沐（Mu Li） [美] 扎卡里·C1