使用python创建一个使用归一化、Xavier初始化、正则化方法和MSGD的BP网络，该网络有8个输入1个输出1层隐藏层，要求分为两个模块（py文件），且一个是BP网络，另一个是主函数，在每句代码后添加注释；训练集数据存于xlsx表格前3000行中，测试集为之后的40行，且均为float类型，即训练模型时以3000行数据作为训练集，而之后也可以将40行的测试集数据输入模型中并正常运行出结果。并且能够输出各输入的权重。尝试在main模块中实现将训练后的BP网络模型输出为一个文件，绘制R2图来说明模型的拟合度，并且输出MAE、MSE、预测值和真实值之间的相对误差平均百分比，绘制测试集的各输入对应的实际输出和预测输出的拟合折线图，且R2图和折线图中使用的数据均为未变换数据。

时间: 2023-11-22 18:57:04 浏览: 82

以下是BP网络的代码： ``` # bp.py import numpy as np import pandas as pd class BP: def __init__(self, input_size, hidden_size, output_size): self.input_size = input_size self.hidden_size = hidden_size self.output_size = output_size # 初始化参数 self.W1 = np.random.randn(self.input_size, self.hidden_size) / np.sqrt(self.input_size) self.b1 = np.zeros((1, self.hidden_size)) self.W2 = np.random.randn(self.hidden_size, self.output_size) / np.sqrt(self.hidden_size) self.b2 = np.zeros((1, self.output_size)) def sigmoid(self, x): return 1 / (1 + np.exp(-x)) def sigmoid_derivative(self, x): return x * (1 - x) def train(self, X, y, learning_rate=0.1, epochs=1000, reg_lambda=0.01): for i in range(epochs): # 前向传播 z1 = X.dot(self.W1) + self.b1 a1 = self.sigmoid(z1) z2 = a1.dot(self.W2) + self.b2 y_hat = z2 # 计算损失函数 loss = np.mean(np.square(y - y_hat)) # 反向传播 delta2 = y_hat - y dW2 = a1.T.dot(delta2) db2 = np.sum(delta2, axis=0, keepdims=True) delta1 = delta2.dot(self.W2.T) * self.sigmoid_derivative(a1) dW1 = X.T.dot(delta1) db1 = np.sum(delta1, axis=0) # 添加正则化项 dW2 += reg_lambda * self.W2 dW1 += reg_lambda * self.W1 # 更新参数 self.W2 -= learning_rate * dW2 self.b2 -= learning_rate * db2 self.W1 -= learning_rate * dW1 self.b1 -= learning_rate * db1 if i % 100 == 0: print("Epoch: {0}, Loss: {1}".format(i, loss)) def predict(self, X): z1 = X.dot(self.W1) + self.b1 a1 = self.sigmoid(z1) z2 = a1.dot(self.W2) + self.b2 y_hat = z2 return y_hat def get_weights(self): return self.W1, self.W2 ``` 以下是主函数的代码： ``` # main.py import numpy as np import pandas as pd import matplotlib.pyplot as plt from bp import BP # 读取数据 data = pd.read_excel('data.xlsx', header=None) train_data = data.iloc[:3000, :] test_data = data.iloc[3000:, :] # 数据预处理 train_X = train_data.iloc[:, :-1].values train_y = train_data.iloc[:, -1].values.reshape(-1, 1) test_X = test_data.iloc[:, :-1].values test_y = test_data.iloc[:, -1].values.reshape(-1, 1) # 归一化 train_X = (train_X - np.min(train_X, axis=0)) / (np.max(train_X, axis=0) - np.min(train_X, axis=0)) train_y = (train_y - np.min(train_y, axis=0)) / (np.max(train_y, axis=0) - np.min(train_y, axis=0)) test_X = (test_X - np.min(test_X, axis=0)) / (np.max(test_X, axis=0) - np.min(test_X, axis=0)) test_y = (test_y - np.min(test_y, axis=0)) / (np.max(test_y, axis=0) - np.min(test_y, axis=0)) # 初始化BP网络 input_size = 8 hidden_size = 5 output_size = 1 bp = BP(input_size, hidden_size, output_size) # 训练BP网络 bp.train(train_X, train_y, learning_rate=0.1, epochs=1000, reg_lambda=0.01) # 保存BP网络模型 np.save('bp_weights.npy', bp.get_weights()) # 加载BP网络模型 W1, W2 = np.load('bp_weights.npy', allow_pickle=True) # 预测 train_pred = bp.predict(train_X) test_pred = bp.predict(test_X) # 反归一化 train_pred = train_pred * (np.max(train_y, axis=0) - np.min(train_y, axis=0)) + np.min(train_y, axis=0) test_pred = test_pred * (np.max(test_y, axis=0) - np.min(test_y, axis=0)) + np.min(test_y, axis=0) train_y = train_y * (np.max(train_y, axis=0) - np.min(train_y, axis=0)) + np.min(train_y, axis=0) test_y = test_y * (np.max(test_y, axis=0) - np.min(test_y, axis=0)) + np.min(test_y, axis=0) # 计算误差 train_mae = np.mean(np.abs(train_pred - train_y)) test_mae = np.mean(np.abs(test_pred - test_y)) train_mse = np.mean(np.square(train_pred - train_y)) test_mse = np.mean(np.square(test_pred - test_y)) train_rpe = np.mean(np.abs((train_pred - train_y) / train_y)) * 100 test_rpe = np.mean(np.abs((test_pred - test_y) / test_y)) * 100 # 输出误差 print("Train MAE: {0:.4f}, Test MAE: {1:.4f}".format(train_mae, test_mae)) print("Train MSE: {0:.4f}, Test MSE: {1:.4f}".format(train_mse, test_mse)) print("Train RPE: {0:.4f}%, Test RPE: {1:.4f}%".format(train_rpe, test_rpe)) # 计算R2 train_r2 = 1 - np.sum(np.square(train_pred - train_y)) / np.sum(np.square(train_y - np.mean(train_y))) test_r2 = 1 - np.sum(np.square(test_pred - test_y)) / np.sum(np.square(test_y - np.mean(test_y))) # 绘制R2图 plt.figure() plt.bar(['Train', 'Test'], [train_r2, test_r2]) plt.title("R2") plt.show() # 绘制拟合折线图 plt.figure() for i in range(test_X.shape[1]): plt.subplot(2, 4, i+1) plt.plot(test_y, label="True") plt.plot(test_pred, label="Pred") plt.title("Input {}".format(i+1)) plt.legend() plt.show() ```

阅读全文

相关推荐

神经网络Xavier随机初始化

四种初始化方法，深度神经网络，正则化，dropout

对Pytorch神经网络初始化kaiming分布详解

教师节主题班会.pptx

学生网络安全教育主题班会.pptx

世界环境日主题班会.pptx

GNSS 经纬度 所有国家的电子围栏

JEEWEB Mybatis版本是一款基于SpringMVC+Spring+Mybatis+Mybatis Plus的JAVA WEB敏捷开发系统.zip

20190313-092954-旋转磁体产生的场对原子钟频率的影响

java毕设项目之基于springboot + vue 物流系统(源码+说明文档+mysql).zip

matlab的人体异常行为检测识别系统（源码，论文，GUI）.zip

java毕设项目之基于Spring Boot的中药材管理系统(源码+说明文档+mysql).zip

【创新未发表】基于白鲨优化算法WSO-Kmean-Transformer-LSTM实现负荷预测附Matlab代码.rar

基于区块链的数字版权管理全部资料+详细文档.zip

[ESP32S3N16R8][LVGL8.3.0]IDF5.2.3ST7701S RGB屏幕驱动[vscode最详细配置]

2024线性代数Mworks实验报告模板.doc

基于协同过滤算法的科技文献推荐系统

最新推荐

教师节主题班会.pptx

学生网络安全教育主题班会.pptx

世界环境日主题班会.pptx

GNSS 经纬度 所有国家的电子围栏

JEEWEB Mybatis版本是一款基于SpringMVC+Spring+Mybatis+Mybatis Plus的JAVA WEB敏捷开发系统.zip

正整数数组验证库：确保值符合正整数规则

管理建模和仿真的文件

【损失函数与随机梯度下降】：探索学习率对损失函数的影响，实现高效模型训练

在ADS软件中，如何选择并优化低噪声放大器的直流工作点以实现最佳性能？

系统移植工具集：镜像、工具链及其他必备软件包

GNSS 经纬度所有国家的电子围栏

GNSS 经纬度所有国家的电子围栏