吴恩达深度学习：优化4层神经网络的实战指南

str函数

吴恩达

5 浏览量更新于2024-08-30 收藏 712KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

本篇文章是关于吴恩达教授神经网络课程中关于优化技术在猫脸识别4层神经网络中的应用总结。作者将继续在上一章节的基础上，介绍如何在模型中引入正则化、dropout、动量梯度下降以及Adam优化器，以提升神经网络的学习性能。首先，文章强调了在优化设置上的重要性，这些设置可以帮助防止过拟合，并加速收敛。正则化是一种常用的技术，通过在损失函数中添加权重衰减项，限制模型参数的大小，防止它们过大而导致泛化能力下降。dropout是一种随机失活策略，随机关闭一部分神经元，以减少神经元之间的共适应性，提高模型的鲁棒性。动量梯度下降是一种改进的优化算法，它引入了过去梯度的记忆，使得更新方向更倾向于历史上的“好”方向，有助于更快地找到全局最优解。Adam（Adaptive Moment Estimation）算法结合了动量梯度和RMSprop（Root Mean Square Propagation），它自适应地调整每个参数的学习率，根据动量项和梯度的一阶矩估计进行更新，通常能提供更好的收敛速度和稳定性。文章开始部分，作者导入必要的库，如`load_dataset`用于加载数据集，`numpy`处理数值计算，`matplotlib`用于可视化，`h5py`处理HDF5文件。然后定义了一些关键变量，如训练集和测试集中图片的数量（`m_train`和`m_test`）、图片的宽度和高度（`num_px`），以及对数据进行预处理，将二维数组展平并归一化到0-1范围。接下来，作者引入He初始化方法来初始化神经网络的权重和偏置，这是一种针对ReLU激活函数设计的初始化策略，能够确保网络在初始化时具有良好的性能。`initialize_parameters_deep`函数负责根据给定的层数和节点数来初始化这些参数。总结来说，这篇文章深入讲解了如何在吴恩达的神经网络课程中，通过正则化、dropout、动量梯度下降和Adam优化等手段来提升一个4层神经网络在猫脸识别任务中的表现。通过学习和实践这些优化技术，读者可以更好地理解深度学习模型的训练过程，并掌握如何调整模型以获得更好的性能。

资源详情

资源推荐

assert (cost.shape == ())

return cost

无添加剂更新梯度无添加剂更新梯度

def update_parameters(parameters, grads, learning_rate):

'''

使用梯度下降法更新模型参数

参数：

parameters：模型参数

grads：计算的参数梯度字典形式

learning_rate:学习率

parameters：更新后的参数字典形式

parameters["W" + str(l)] = ...

parameters["b" + str(l)] = ...

'''

L = len(parameters) // 2 # 神经网络层数（输入层是第0层不算输入层）

# 一次梯度下降迭代更新参数

for l in range(L): # l 0~L-1

parameters['W' + str(l + 1)] = parameters['W' + str(l + 1)] - learning_rate * grads['dW' + str(l + 1)] parameters['b' + str(l + 1)] = parameters['b' + str(l + 1)] - learning_rate *

grads['db' + str(l + 1)]

return parameters

一，重要步骤：添加正则（损失函数）一，重要步骤：添加正则（损失函数）

#损失函数加正则

def compute_cost_with_regularization(AL, Y,parameters, lambd):

W1 = parameters['W1'] W2 = parameters['W2'] W3 = parameters['W3'] W4 = parameters['W4'] m = AL.shape[1] cross_entropy_cost = compute_cost(AL, Y)

L2_reglarization_cost = 1. / m * lambd / 2 * (

np.sum(np.square(W1)) + np.sum(np.square(W2)) + np.sum(np.square(W3) + np.sum(np.square(W4))))

cost = L2_reglarization_cost + cross_entropy_cost

return cost

反向传播加入正则反向传播加入正则

def sigmoid_backward(dA, cache):

'''

sigmoid激活单元(输出层)的反向传播

参数：

dA：当前层(输出层)激活输出AL的梯度

cache:存储当前层(输出层)的线性组合输出Z,方便激活单元反向传播的计算

dZ:当前层(输出层)线性组合输出Z的梯度

'''

Z = cache

s = 1. / (1 + np.exp(-Z))

# dZ=dA*(A对Z求导) A=sigmoid(Z) A对Z的导数=A(1-A)

dZ = dA * s * (1 - s)

assert (dZ.shape == Z.shape)

剩余10页未读，继续阅读

weixin_38580759

粉丝: 4
资源: 971

吴恩达深度学习：优化4层神经网络的实战指南

吴恩达卷积神经网络课后作业数据集

吴恩达机器学习课后作业源码及笔记_机器学习_吴恩达_

csdn吴恩达深度学习课后作业何宽

吴恩达机器学习svm课后作业数据

我需要吴恩达机器学习的课后习题

吴恩达深度学习课后作业rnn

吴恩达课后编程作业matlab原文件

吴恩达机器学习神经网络实验目的

告诉我吴恩达的deep Learn的作业

神经网络和SVM 吴恩达作业

吴恩达深度学习课后题

怎么运行吴恩达深度学习课后联系

吴恩达cs229 作业数据集 下载

jupyter吴恩达作业

机器学习神经网络吴恩达

吴恩达机器学习神经网络的实验流程

deeplearning.ai版吴恩达作业

jupyter notebook 吴恩达

吴恩达深度学习正则化编程作业

吴恩达机器学习代码优化

最新资源

吴恩达cs229 作业数据集下载