深度学习基础到实践：卷1

需积分: 10 11 浏览量更新于2024-07-18 2 收藏 130.28MB PDF 举报

"《Deep Learning Vol. 1 From Basics to Practice》是由Andrew Glassner编写的深度学习基础到实践的教程，涵盖了从机器学习基础知识到深度学习核心算法的多个章节。" 该书详细介绍了深度学习的基础知识，从机器学习的入门概念开始，逐渐深入到统计学、概率论以及贝叶斯规则等数学基础。这些章节对于理解和构建深度学习模型至关重要，因为它们提供了对数据建模和预测的基本理解。统计学章节涉及了数据分析的基础，包括描述性统计、假设检验和回归分析，这些都是理解和解释数据的关键工具。概率论章节则讲解了随机事件的概率、条件概率以及联合概率，这些都是构建概率模型和理解不确定性所必需的。而贝叶斯规则是概率论中的一个核心概念，用于更新先验知识并计算后验概率，对于推理和决策过程具有重要意义。接着，书中探讨了曲线与曲面，这是理解多维数据和神经网络中权重空间的重要概念。信息理论章节则讨论了熵、互信息和条件熵，这些概念在优化模型和压缩信息时起着重要作用。在机器学习部分，书中详细介绍了分类问题，讨论了监督学习中的训练与测试过程，以及过拟合和欠拟合的概念。这些内容对于避免模型在新数据上的泛化能力降低至关重要。随后，书中还涉及了神经元模型，以及学习和推理的过程。数据预处理是机器学习中的重要步骤，第12章对此进行了讲解，包括特征选择、标准化和归一化等技术。接着，第13章介绍了各种分类器，如逻辑回归、支持向量机等，并在第14章讨论了集成方法，如随机森林和梯度提升，以提高模型的准确性和稳定性。第15章专门介绍了Scikit-Learn，这是一个广泛使用的Python机器学习库，包含多种预训练的分类、回归和聚类算法。后续章节则转向深度学习的核心内容，包括前馈神经网络、激活函数（如Sigmoid、ReLU）以及反向传播算法，这些都是构建和训练深度学习模型的基础。最后，书中还讨论了优化器，如梯度下降的不同变种，用于改善模型训练的效率和性能。《Deep Learning Vol. 1 From Basics to Practice》是一部全面介绍深度学习的教材，从基础知识出发，逐步引导读者进入深度学习的世界，为实践中的深度学习项目提供了坚实的基础。通过阅读本书，读者可以系统地掌握深度学习所需的理论知识和实践技巧。

18.12 Discussion ..................................................... 787

18.12.1 Backprop In One Place ..................................... 787

18.12.2 What Backprop Doesn’t Do ............................ 789

18.12.3 What Backprop Does Do ................................. 789

18.12.4 Keeping Neurons Happy .................................790

18.12.5 Mini-Batches ..................................................... 795

18.12.6 Parallel Updates ............................................... 796

18.12.7 Why Backprop Is Aractive ............................ 797

18.12.8 Backprop Is Not Guaranteed ......................... 797

18.12.9 A Lile History ................................................. 798

18.12.10 Digging into the Math .................................... 800

References ..............................................................802

Chapter 19: Optimizers .........................................805

19.1 Why This Chapter Is Here .............................807

19.2 Error as Geometry .........................................807

19.2.1 Minima, Maxima, Plateaus, and Saddles .......... 808

19.2.2 Error as A 2D Curve ........................................... 814

19.3 Adjusting the Learning Rate ........................817

19.3.1 Constant-Sized Updates .................................... 819

19.3.2 Changing the Learning Rate Over Time ......... 829

19.3.3 Decay Schedules ................................................ 832

19.4 Updating Strategies ...................................... 836

19.4.1 Batch Gradient Descent .................................... 837

19.4.2 Stochastic Gradient Descent (SGD) ................ 841

19.4.3 Mini-Batch Gradient Descent .......................... 844

19.5 Gradient Descent Variations ........................846

19.5.1 Momentum ......................................................... 847

19.5.2 Nesterov Momentum ........................................ 856

19.5.3 Adagrad ............................................................... 862

19.5.4 Adadelta and RMSprop ..................................... 864

19.5.5 Adam ................................................................... 866

References ..............................................................923

Image credits: ................................................................ 925

Chapter 21: Convolutional Neural Networks ......927

21.1 Why This Chapter Is Here .............................930

21.2 Introduction ...................................................931

21.2.1 The Two Meanings of “Depth” ........................... 932

21.2.2 Sum of Scaled Values ......................................... 933

21.2.3 Weight Sharing ................................................... 938

21.2.4 Local Receptive Field ........................................ 940

21.2.5 The Kernel ........................................................... 943

21.3 Convolution ....................................................944

21.3.1 Filters ................................................................... 948

21.3.2 A Fly’s-Eye View ................................................. 953

21.3.3 Hierarchies of Filters ......................................... 955

21.3.4 Padding ............................................................... 963

21.3.5 Stride ................................................................... 966

21.4 High-Dimensional Convolution ...................971

21.4.1 Filters with Multiple Channels ......................... 975

24.4.2 Striding for Hierarchies .................................... 977

24.5 1D Convolution ..............................................979

24.6 1×1 Convolutions ........................................... 980

24.7 A Convolution Layer .....................................983

24.7.1 Initializing the Filter Weights ........................... 984

24.8 Transposed Convolution ..............................985

24.9 An Example Convnet ....................................991

24.9.1 VGG16 ................................................................. 996

21.9.2 Looking at the Filters, Part 1 ............................. 1001

21.9.3 Looking at the Filters, Part 2 ............................ 1008

Chapter 23: Keras Part 1 ........................................1090

23.1 Why This Chapter Is Here .............................1093

23.1.1 The Structure of This Chapter ........................... 1094

23.1.2 Notebooks ........................................................... 1094

23.1.3 Python Warnings ................................................ 1094

23.2 Libraries and Debugging ..............................1095

23.2.1 Versions and Programming Style ..................... 1097

23.2.2 Python Programming and Debugging ............ 1098

23.3 Overview ........................................................1100

23.3.1 What’s a Model? ................................................. 1101

23.3.2 Tensors and Arrays ............................................ 1102

23.3.3 Seing Up Keras ................................................ 1102

23.3.4 Shapes of Tensors Holding Images .................1104

23.3.5 GPUs and Other Accelerators ......................... 1108

23.4 Geing Started .............................................1109

23.4.1 Hello, World ........................................................ 1110

23.5 Preparing the Data .......................................1114

23.5.1 Reshaping ............................................................ 1115

23.5.2 Loading the Data ............................................... 1126

23.5.3 Looking at the Data .......................................... 1129

23.5.4 Train-test Spliing ............................................ 1136

23.5.5 Fixing the Data Type ......................................... 1138

23.5.6 Normalizing the Data ....................................... 1139

23.5.7 Fixing the Labels ................................................ 1142

23.5.8 Pre-Processing All in One Place ...................... 1148

23.6 Making the Model ........................................1150

23.6.1 Turning Grids into Lists ..................................... 1152

23.6.2 Creating the Model ........................................... 1154

23.6.3 Compiling the Model ........................................ 1163

23.6.4 Model Creation Summary ............................... 1167

剩余908页未读，继续阅读

DoomLord

粉丝: 114
资源: 1317

深度学习基础到实践：卷1

Deep Learning Vol 1 From Basics to Practice_带书签.pdf

Deep Learning, Vol. 1: From Basics to Practice

Deep Learning - From basics to practice - Vol. 1

Deep Learning, Vol. 2 From Basics to Practice

Deep Learning, Vol. 1 From Basics to Practice 无水印原版pdf

Deep Learning, Vol. 2: From Basics to Practice

Sanet.st_Deep_Learning,_Vol._2_From_Basics_to_Practice_-_Andrew_Glassner_带书签.pdf

deep learning from basics to practice vol.2

深度学习基础与实践：卷1

基于纯verilogFPGA的双线性差值视频缩放 功能：利用双线性差值算法，pc端HDMI输入视频缩小或放大，然后再通过HDMI输出显示，可以任意缩放 缩放模块仅含有ddr ip，手写了 ram,f

最新资源

基于纯verilogFPGA的双线性差值视频缩放功能：利用双线性差值算法，pc端HDMI输入视频缩小或放大，然后再通过HDMI输出显示，可以任意缩放缩放模块仅含有ddr ip，手写了 ram,f