3-3-4型BP神经网络训练与测试实现

需积分: 0 88 浏览量更新于2024-08-05 收藏 1.03MB PDF 举报

"HIT19S103256文荟俨1 - 实现3-3-4型BP神经网络，使用Softmax输出，训练4类三维数据，比较后验概率，计算识别率。" 在本次实验中，重点涉及了人工神经网络中的反向传播（Backpropagation, BP）算法，以及训练和测试神经网络的基本流程。实验的目标是通过编程实现一个3-3-4结构的BP神经网络，即输入层有3个节点，隐藏层有3个节点，输出层有4个节点。以下是实验的详细步骤和关键知识点： 1. **数据生成**：生成4000个训练样本，每类1000个，共4类。这些样本服从高斯分布，采用`np.random.multivariate_normal()`方法生成，具有三维特征。数据被分为训练集（80%）和测试集（20%），以4:1的比例。 2. **网络结构定义**：网络采用带偏置项的BP结构，隐藏层使用ReLU激活函数，输出层使用Softmax函数，确保输出是概率分布。损失函数选用均方误差（Mean Squared Error, MSE），计算输出层与目标向量的差距。 - 输入层：接受三维输入。 - 隐藏层：3个节点，使用ReLU激活，其函数形式为`f(x) = max(0, x)`，在负区间为0，正区间线性增长，有助于避免梯度消失问题。 - 输出层：4个节点，使用Softmax函数，将每个节点的激活值转换为概率，确保所有节点值之和为1。 3. **前向传播**：输入向量经过输入层，其每个单元的输出等于输入向量对应元素。隐藏层每个节点的净激活值是输入信号与权重的加权和。激活值计算公式为`net = w1*x1 + w2*x2 + w3*x3 + bias`，其中`w`是权重，`x`是输入，`bias`是偏置。 4. **反向传播**：计算输出层的误差，并根据梯度下降法更新权重。误差反向传播到隐藏层，再次计算隐藏层的误差，并更新隐藏层的权重。这个过程反复进行，直到权重收敛或达到预设的训练迭代次数。 5. **训练算法**：通过不断调整权重和偏置，使得网络的预测输出逐渐接近目标输出，从而最小化损失函数。常用的学习算法有随机梯度下降（Stochastic Gradient Descent, SGD）、批量梯度下降（Batch Gradient Descent,BGD）和小批量梯度下降（Mini-Batch Gradient Descent）。 6. **样本预测**：训练完成后，使用训练好的网络对测试集进行预测，计算预测的后验概率。同时，利用贝叶斯公式计算理论上的置信度，对比两者以评估网络性能。 7. **识别率计算**：生成一组测试样本集，通过网络进行预测，然后与真实类别比较，计算识别正确样本的比例，即为识别率。这个实验不仅涵盖了神经网络的基本构建，还包括了数据预处理、模型训练、性能评估等多个关键环节，是理解深度学习和BP神经网络原理的实践案例。

BP 网络的训练与测试

文荟俨 19S103256

⼀、实验⺫的

编程实现 3-3-4 型 (即输入层为 3，隐藏层为 3，输出层为 4)BP 神经网络算

法，熟练掌握前向传播和反向传播学习算法，使用 Softmax 输出函数，等概率生

成 4 类三维数据进行训练。利用训练好的网络估计几个样本的后验概率，和使用

贝叶斯公式进行理论计算的置信度作对比，并生成一组测试样本集，计算识别率。

⼆、实验计划

1. 生成数据

生成 4000 个模式的训练集 D，每一类均服从高斯分布，各有 1000 个训练样

本，按照训练集、测试集 4:1 进行划分。具体参数如表 1 所示，样本维度为三维。

表 1 样本生成参数表

生成样本时，我们采用 np.random.multivariate_normal (mean, cov, size=None,

check_valid=None, tol=None)方法，它用于生成多元正态分布矩阵。其中 mean 和

cov 为必要的传参，而 size，check_valid 以及 tol 为可选参数。

2.网络结构定义

网络采用 3-3-4 型 BP 网，含偏置项，隐藏层激活函数采用 ReLU，输出层

采用 Softmax，损失函数 J(W)采用均方差，定义为输出端期望输出

𝑡

和实际输出

𝑧

的差的平方和，如式(1)所示：

. (1)

1 0

0101

21 022

0125

30 [2,6,1]

4 0.5 [2,1,3]

Diag

æö æ ö

ç÷ ç ÷

èø è ø

æö

ç÷

èø

æö

ç÷

èø

下载后可阅读完整内容，剩余9页未读，立即下载

金山文档

粉丝: 32
资源: 306

3-3-4型BP神经网络训练与测试实现

模式识别实验二-文荟俨-19S1032561

算法实验4-19S103256文荟俨1

算法实验1-19S103256文荟俨1

算法实验3-19S103256文荟俨1

算法实验2-19S103256文荟俨1

A*算法在寻路问题中的应用-19S103256文荟俨实验报告

实验二：BP神经网络的训练与测试-文荟俨

lazy_src="//pic2.58cdn.com.cn/anjuke_58/921a7fd04017ba9753f227a0728761df?w=1080" src="//img.58cdn.com.cn/ui7/fang/detail/img/default.png" alt="整租｜东方文荟苑四区 龥室龥厅龥卫 餼龒平"> 请写出PHP编写的只匹配字符串‘东方文荟苑四区’的正则

mobilenet模型-基于人工智能的卷积网络训练识别自驾旅行路标-不含数据集图片-含逐行注释和说明文档.zip

最新资源

lazy_src="//pic2.58cdn.com.cn/anjuke_58/921a7fd04017ba9753f227a0728761df?w=1080" src="//img.58cdn.com.cn/ui7/fang/detail/img/default.png" alt="整租｜东方文荟苑四区龥室龥厅龥卫餼龒平"> 请写出PHP编写的只匹配字符串‘东方文荟苑四区’的正则