激活函数与神经网络结构：BP神经网络详解

需积分: 0 41 浏览量更新于2024-08-05 收藏 953KB PDF 举报

BP神经网络是一种基于反向传播算法的人工神经网络，它通过调整连接权重来实现对复杂函数的学习和拟合。在构建神经网络时，以下几个关键概念是不可或缺的： 1. **激活函数**： - 激活函数的作用在于引入非线性，使得神经网络能处理更复杂的函数映射。常见的激活函数包括： - **Sigmoid**函数：其公式为$f(x) = \frac{1}{1+e^{-x}}$，输出范围在0到1之间，常用于二分类问题的输出层，但可能容易导致梯度消失问题。 - **ReLU (Rectified Linear Unit)**：$f(x) = max(0, x)$，当输入为负时输出0，正则输出不变，解决Sigmoid函数的梯度消失问题，适用于隐藏层。 - **Tanh (双曲正切)**：$f(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$，输出范围在-1到1，比Sigmoid更适合连续输出。 - **Softmax**：用于多分类问题的输出层，将多个神经元的输出转换为概率分布，每个值都在0到1之间且总和为1。 2. **神经网络结构**： - BP神经网络通常包含输入层、隐藏层和输出层。举例来说，一个具体的结构可能如下： - 输入层（2个神经元） - 隐藏层1（3个神经元） - 隐藏层2（2个神经元） - 输出层（根据任务不同，可能是Sigmoid用于二分类，或Softmax用于多分类） 3. **损失函数**： - 损失函数衡量模型预测结果与真实值之间的差距，常见的有： - **绝对值损失函数（$L_1$损失）**：衡量预测值与真实值绝对差的平均，适用于异常值不敏感的问题。 - **平方损失函数（$L_2$损失，也称均方误差）**：衡量预测值与真实值平方差的平均，对异常值更敏感，但平滑性较好。 - **交叉熵损失**：在分类问题中常用，特别是对于多分类问题，如Softmax层后，用于优化模型的参数。 4. **权重表示**： - $w_{jk}^{[l]}$表示连接权重，即从第$(l-1)$层第$k$个神经元到第$l$层第$j$个神经元的权重。在训练BP神经网络时，通过梯度下降或其他优化算法更新这些权重，以最小化损失函数，从而提高模型的预测性能。理解这些核心概念对于有效设计和训练神经网络至关重要。

BP神经网络.md

2022/4/27

3 / 13

符号约定

$w_{j k}^{[l]}$表示从网络第$(l-1)^{t h}$ 层第$k^{t h}$ 个神经元指向第 $l^{t h}$ 层第 $j^{t h}$ 个神经元的连

接权重，同时也是第 $l$ 层权重矩阵第 $j$ 行第 $k$ 列的元素。例如，上图中 $w_{21}^{[1]}$ ，第0层第1个神

经元指向第1层第2个神经元的权重（褐色），也就是第 1 层权重矩阵第 2 行第 1 列的元素。同理，使用

$b_{j}^{[l]}$ 表示第 $l^{t h}$ 层第 $j^{t h}$ 个神经元的偏置，同时也是第 $l$ 层偏置向量的第 $j$ 个元素。使

用 $z_{j}^{[l]}$ 表示第 $l^{t h}$ 层第 $j^{t h}$ 个神经元的线性结果，使用 $a_{j}^{[l]}$ 来表示第 $l^{t h}$ 层第

$j^{t h}$ 个神经元的激活函数输出。其中，激活函数使用符号σ表示，第 $l^{t h}$ 层中第 $j^{t h}$ 个神经元的

激活为:

$$ a_{j}^{[l]}=\sigma(z_{j}^{[l]})=\sigma\left(\sum_{k} w_{j k}^{[l]} a_{k}^{[l-1]}+b_{j}^{[l]}\right) $$ $w^{[l]}$ 表

示第 $l$ 层的权重矩阵，$b^{[l]}$ 表示第 $l$ 层的偏置向量，$a^{[l]}$ 表示第 $l$ 层的神经元向量，结合上图

讲述：

$w^{[1]}=\left[\begin{array}{lll}w_{11}^{[1]} & w_{12}^{[1]} & \ w_{21}^{[1]} & w_{22}^{[1]} & \ w_{31}^{[1]} &

w_{32}^{[1]}\end{array}\right]$ $w^{[2]}=\left[\begin{array}{lll}w_{11}^{[2]} & w_{12}^{[2]} & w_{13}^{[2]} \

w_{21}^{[2]} & w_{22}^{[2]} & w_{23}^{[2]}\end{array}\right]$

$b^{[1]}=\left[\begin{array}{l}b_{1}^{[1]} \ b_{2}^{[1]} \ b_{3}^{[1]}\end{array}\right]$

$b^{[2]}=\left[\begin{array}{l}b_{1}^{[2]} \ b_{2}^{[2]}\end{array}\right]$

进行线性矩阵运算。

$z^{[1]}=\left[\begin{array}{lll}w_{11}^{[1]} & w_{12}^{[1]} & \ w_{21}^{[1]} & w_{22}^{[1]} & \ w_{31}^{[1]} &

w_{32}^{[1]}\end{array}\right] \cdot\left[\begin{array}{c}a_{1}^{[0]} \

a_{2}^{[0]}\end{array}\right]+\left[\begin{array}{l}b_{1}^{[1]} \ b_{2}^{[1]} \

b_{3}^{[1]}\end{array}\right]=\left[\begin{array}{c}w_{11}^{[1]} a_{1}^{[0]}+w_{12}^{[1]} a_{2}^{[0]}+b_{1}^{[1]} \

w_{21}^{[1]} a_{1}^{[0]}+w_{22}^{[1]}a_{2}^{[0]}+b_{2}^{[1]} \

w_{31}^{[1]}a_{1}^{[0]}+w_{32}^{[1]}a_{2}^{[0]}+b_{3}^{[1]}\end{array}\right]$

剩余12页未读，继续阅读

彥爷

粉丝: 24
资源: 311

激活函数与神经网络结构：BP神经网络详解

BP神经网络,bp神经网络预测模型,Python

python 用GA算法优化BP神经网络.zip

BP_PID.zip_BPNN优化PID参数_BP神经网络PID_bp pid_pid参数自整定_神经网络

BP(C).rar_BP 神经网络_BP 神经网络 程序_BP神经网络_bp神经网络程序

BP神经网络.rar_BP神经网络_bp神经网络程序_神经网络

BP神经网络做预测.rar_BP神经网络_BP神经网络做预测_bp 预测_神经网络 预测_预测

基于BP神经网络的回归分析，基于优化动量因子的BP神经网络，基于优化学习率的BP神经网络，基于优化隐藏层神经元的bp神经网络

BP神经网络实现图像压缩.rar_BP 图像压缩_BP神经网络_BP神经网络实现图像压缩_图像压缩_神经网络 图像

BP.rar_BP_bp神经网络 matlab_matlab BP神经网络_神经网络 matlab

BP 神经网络labview.rar_BP神经网络_LabVIEW BP_RU1_labview神经网络

最新资源

BP(C).rar_BP 神经网络_BP 神经网络程序_BP神经网络_bp神经网络程序

BP神经网络做预测.rar_BP神经网络_BP神经网络做预测_bp 预测_神经网络预测_预测

BP神经网络实现图像压缩.rar_BP 图像压缩_BP神经网络_BP神经网络实现图像压缩_图像压缩_神经网络图像