深度学习实践：批量归一化与残差网络解析

177 浏览量更新于2024-08-29 收藏 182KB PDF 举报

"伯禹动手学深度学习打卡09 之批量归一化和残差网络" 批量归一化（Batch Normalization）是深度学习中的一种重要技术，用于改善神经网络的训练过程。它通过对每层的输入或中间激活进行规范化，确保其在训练过程中具有稳定的分布，从而提高学习效率并减少梯度消失或爆炸的问题。批量归一化的应用分为两种情况：浅层模型和深度模型。在浅层模型中，批量归一化用于对输入数据进行预处理，使输入的每个特征在数据集上具有0均值和1标准差。这种标准化操作有助于减小特征之间的差异，使得网络能够更有效地学习。在深度模型中，批量归一化的应用更为复杂。它被插入到神经网络的层间，通常位于全连接层的仿射变换和激活函数之间，以及卷积层的卷积运算之后、激活函数之前。这样做的目的是在训练过程中，通过每个小批量数据的均值和标准差来不断调整中间输出，使得不同层的输出保持相对稳定的数值范围，从而加速训练并提高模型性能。对于全连接层，批量归一化在权重矩阵乘法后、激活函数前进行。而对于卷积层，由于可能存在多个输出通道，每个通道都需要独立进行批量归一化，并有自己的拉伸和偏移参数。在计算过程中，例如对于一个大小为pxq的卷积输出，会基于当前小批量数据计算均值和方差，然后应用批量归一化。在预测阶段，批量归一化不再依赖于小批量数据的均值和方差，而是使用在训练期间通过移动平均估计的整个数据集的均值和方差，以保持一致性。批量归一化的一个关键参数是动量（momentum），它用于控制在计算移动平均时过去批次的影响。另一个参数是ε，用于防止分母为零的风险，保证数值稳定性。除了批量归一化，残差网络（Residual Networks）也是深度学习中的一个重要概念。残差网络通过引入“跳跃连接”，允许信息直接从输入传递到输出，解决了深度网络中梯度消失的问题，使得训练更深的网络成为可能。残差块的设计使得网络可以更轻松地学习身份映射，提高了模型的表达能力和训练效率。在实际实现批量归一化时，通常会结合深度学习框架如PyTorch进行编程。代码示例中展示了如何在训练和预测模式下实现批量归一化的过程，包括计算均值、方差以及应用标准化。批量归一化和残差网络是深度学习中优化模型性能的关键工具，它们分别通过标准化层间输出和提供梯度传递的捷径，促进了深层神经网络的训练和性能提升。

伯禹伯禹动手学深度学习动手学深度学习打卡打卡09 之批量归一化和残差网络之批量归一化和残差网络

批量归一化（批量归一化（BatchNormalization））

对输入的标准化（浅层模型）

处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。

标准化处理输入数据使各个特征的分布相近

批量归一化（深度模型）

利用小批量上的均值和标准差，不断调整神经网络中间输出，从而使整个神经网络在各层的中间输出的数值更稳定。

1.对全连接层做批量归一化对全连接层做批量归一化

位置：全连接层中的仿射变换和激活函数之间。

全连接：

2.对卷积层做批量归对卷积层做批量归化化

位置：卷积计算之后、应激活函数之前。

如果卷积计算输出多个通道，我们需要对这些通道的输出分别做批量归一化，且每个通道都拥有独立的拉伸和偏移参数。

计算：对单通道，batchsize=m,卷积计算输出=pxq 对该通道中m×p×q个元素同时做批量归一化,使用相同的均值和方差。

3.预测时的批量归预测时的批量归化化

训练：以batch为单位,对每个batch计算均值和方差。

预测：用移动平均估算整个训练数据集的样本均值和方差。

从零实现从零实现

import time

import torch

from torch import nn, optim

import torch.nn.functional as F

import torchvision

import sys

sys.path.append("/home/kesci/input/")

import d2lzh1981 as d2l

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

def batch_norm(is_training, X, gamma, beta, moving_mean, moving_var, eps, momentum):

# 判断当前模式是训练模式还是预测模式

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38653687

粉丝: 3
资源: 973

深度学习实践：批量归一化与残差网络解析

动手学深度学习之从批量归一化和残差网络、凸优化、梯度下降

Pytorch 深度学习 Day03 —批量归一化与残差网格

批量归一化和残差网络

批量归一化和残差网络、稠密连接网络

批量归一化与残差网络.md

深度学习PyTorch实战：批量归一化与残差网络解析

深度学习中的批量归一化与残差网络

深度学习笔记：批量归一化与残差网络实践

深度学习Pytorch：批量归一化与残差网络解析

深度学习中的批量归一化与残差、稠密网络

最新资源