BP算法详解：深度学习中的误差反向传播

需积分: 48 161 浏览量更新于2024-09-09 2 收藏 456KB PDF 举报

" BP算法原理和详细推导流程，涵盖了反向传播算法在BP神经网络中的应用，包括信息前向传播、误差反向传播、权重和偏置参数更新，以及解决梯度消失问题和加速训练的Rprop算法。" BP算法，全称误差反向传播算法，是多层神经网络训练的核心，它使得我们能够有效地计算和调整深层网络中的权重参数。该算法由David E. Rumelhart和James L. McClelland在1986年的《并行分布式处理》一书中首次提出。BP神经网络是由多个层次的神经元构成，其中包含输入层、隐藏层和输出层。每个神经元通过权重与前一层的神经元相连，并使用非线性激活函数进行转换。 1. **信息前向传播**：在BP算法中，首先从输入层开始，每个神经元根据其连接权重和前一层的输出计算其激活值，然后将激活值传递给下一层，直至到达输出层。激活函数通常是Sigmoid、ReLU或Tanh等非线性函数，用于引入非线性特性。 2. **误差反向传播**：一旦前向传播完成，网络的输出与期望输出之间的误差被计算出来。误差反向传播从输出层开始，通过计算每个神经元的局部梯度来确定如何调整权重以减小误差。这一过程按照从输出层到输入层的顺序进行，因此得名“反向传播”。 - **输出层的权重参数更新**：利用输出层的误差和当前层的激活值，可以计算出权重的梯度，进而更新权重。误差反向传播公式通常包括梯度乘以学习率和动量项。 - **隐藏层的权重参数更新**：对于隐藏层，计算误差需要用到上一层的权重更新后的误差信息。隐藏层的权重更新同样基于梯度，但需要通过链式法则来传播误差。 - **偏置参数更新**：无论是输出层还是隐藏层，偏置参数的更新方式与权重类似，只是不考虑前一层的神经元激活值。 3. **BP算法核心公式**：BP算法涉及四个主要公式，分别用于计算权重和偏置的梯度，以及它们的更新。这些公式涉及到误差的传播和梯度的计算，是理解BP算法的关键。 4. **梯度消失问题**：在深层网络中，由于连续的链式法则应用，梯度可能会变得非常小，导致权重更新过于缓慢，这被称为梯度消失问题。解决方法包括使用ReLU等激活函数，初始化技巧，以及残差网络等结构。 5. **Rprop算法**：为了加快BP网络的训练速度，提出了Rprop（Resilient Backpropagation）算法。Rprop根据梯度的符号来调整学习率，使得在梯度方向上学习率增大，而反方向上则减小，从而更有效地收敛。 BP算法是深度学习中不可或缺的工具，它使我们能够训练复杂的多层神经网络模型，解决各种实际问题。然而，也需要注意其存在的问题，如梯度消失和梯度爆炸，以及训练速度等问题，这些都需要通过优化策略和新型算法来解决。

2 信息前向传播

显然，图 1 所示神经网络的第 2 层神经元的状态及激活值可以通过下面的计算得到：

(2)

= w

(2)

+ w

(2)

+ w

(2)

+ b

(2)

= w

(2)

+ w

(2)

+ w

(2)

+ b

(2)

= w

(2)

+ w

(2)

+ w

(2)

+ b

(2)

= f(z

(2)

)

(2)

= f(z

(2)

)

(2)

= f(z

(2)

)

类似地，第 3 层神经元的状态及激活值可以通过下面的计算得到：

(3)

= w

(3)

(2)

+ w

(3)

(2)

+ w

(3)

(2)

+ b

(3)

= w

(3)

(2)

+ w

(3)

(2)

+ w

(3)

(2)

+ b

(3)

= f(z

(3)

)

(3)

= f(z

(3)

)

可总结出，第 l (2 ≤ l ≤ L) 层神经元的状态及激活值为（下面式子是向量表示形式）：

(l)

= W

(l)

(l−1)

+ b

(l)

= f(z

(l)

)

对于 L 层感知器，网络的最终输出为 a

(L)

。前馈神经网络中信息的前向传递过程如下：

x = a

(1)

→ z

(2)

→ · · · → a

(L−1)

→ z

(L)

→ a

(L)

= y

3 误差反向传播

“信息前向传播”讲的是已知各个神经元的参数后，如何得到神经网络的输出。但怎么得到各个神经元的参

数呢？“误差反向传播”算法解决的就是这个问题。

假设训练数据为 {(x

(1)

, y

(1)

), (x

(2)

, y

(2)

), · · · , (x

(i)

, y

(i)

), · · · , (x

(N)

, y

(N)

)} ，即共有 N 个。又假设输出

数据为 n

维的，即 y

(i)

= (y

(i)

, · · · , y

(i)

)

。

对某一个训练数据 (x

(i)

, y

(i)

) 来说，其代价函数可写为：

(i)

∥y

(i)

− o

(i)

∥

∑

k=1

(i)

− o

(i)

)

剩余11页未读，继续阅读

erlin456789

粉丝: 0
资源: 5

BP算法详解：深度学习中的误差反向传播

MIMO雷达BP算法

BP算法MATLAB程序

合成孔径雷达后向投影成像（BP）成像算法

BP神经网络算法公式推导

bp神经网络原理公式推导

BP算法的理论和算法流程公式

sar成像bp算法原理

神经网络BP算法原理

BP神经网络算法推导

bp算法的原理和基本步骤

最新资源