利用均方误差计算两张图片的拟合度python代码及其注释
时间: 2023-07-15 22:11:32 浏览: 118
以下是利用均方误差(MSE)计算两张图片的拟合度的 Python 代码及其注释:
```python
import numpy as np
import cv2
# 读取两张图片
img1 = cv2.imread('path/to/image1.jpg')
img2 = cv2.imread('path/to/image2.jpg')
# 将图片转换为灰度图像
gray_img1 = cv2.cvtColor(img1, cv2.COLOR_BGR2GRAY)
gray_img2 = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
# 计算 MSE
mse = np.mean((gray_img1 - gray_img2) ** 2)
# 输出 MSE 值
print('MSE:', mse)
```
注释:
- 首先,我们需要导入 NumPy 和 OpenCV 库。
- 使用 `cv2.imread()` 函数读取两张图片。这里需要将 `path/to/image1.jpg` 和 `path/to/image2.jpg` 替换成实际的图片路径。
- 使用 `cv2.cvtColor()` 函数将图片转换为灰度图像。这将简化后续的计算。
- 计算 MSE。这里使用了 NumPy 库中的 `np.mean()` 函数计算所有像素点的平均值。
- 最后,输出 MSE 值。MSE 值越小,表示两张图片的拟合度越高。
相关问题
使用python创建一个使用归一化、Xavier初始化、正则化方法和MSGD的BP网络示例,该网络有8个输入1个输出1层隐藏层,要求分为两个模块(py文件),在确认输入、输出的训练集之后,模型不会出现shape类报错,且一个是BP网络,另一个是主函数,尝试在main模块中实现绘制R2图来说明模型的拟合度,并且输出MAE、MSE、预测值和真实值之间的相对误差平均百分比,绘制各输入输出的拟合折线图,且R2图和折线图中使用的数据均为未变换数据,在每句代码后添加注释;练集数据存于xlsx表格前3000行中,之后的都是测试集
这里是一个示例代码,分为两个模块:bp.py 和 main.py
bp.py:
```python
import numpy as np
class BPNN:
def __init__(self, input_size, hidden_size, output_size, lr=0.1, regularization=0.01):
self.input_size = input_size
self.hidden_size = hidden_size
self.output_size = output_size
self.lr = lr
self.regularization = regularization
# 初始化权重
self.W1 = np.random.randn(hidden_size, input_size) * np.sqrt(1/input_size) # Xavier 初始化
self.b1 = np.zeros((hidden_size, 1))
self.W2 = np.random.randn(output_size, hidden_size) * np.sqrt(1/hidden_size) # Xavier 初始化
self.b2 = np.zeros((output_size, 1))
def sigmoid(self, x):
return 1 / (1 + np.exp(-x))
def d_sigmoid(self, x):
return x * (1 - x)
def train(self, X, y, epochs=1000):
for i in range(epochs):
# 前向传播
a1 = X.T
z2 = np.dot(self.W1, a1) + self.b1
a2 = self.sigmoid(z2)
z3 = np.dot(self.W2, a2) + self.b2
y_pred = z3
# 计算损失函数
mse = np.mean((y_pred - y.T) ** 2)
# 反向传播
d3 = y_pred - y.T
d2 = np.dot(self.W2.T, d3) * self.d_sigmoid(a2)
# 更新权重和偏置
self.W2 -= self.lr * (np.dot(d3, a2.T) + self.regularization * self.W2)
self.b2 -= self.lr * np.mean(d3, axis=1, keepdims=True)
self.W1 -= self.lr * (np.dot(d2, a1.T) + self.regularization * self.W1)
self.b1 -= self.lr * np.mean(d2, axis=1, keepdims=True)
return mse, y_pred.T
```
main.py:
```python
import pandas as pd
import matplotlib.pyplot as plt
from bp import BPNN
# 读取数据
df = pd.read_excel('data.xlsx')
X = df.iloc[:3000, :-1].values
y = df.iloc[:3000, -1:].values
# 归一化
X = (X - X.mean(axis=0)) / X.std(axis=0)
y = (y - y.mean(axis=0)) / y.std(axis=0)
# 划分训练集和测试集
X_train, y_train = X[:2500], y[:2500]
X_test, y_test = X[2500:], y[2500:]
# 初始化模型
model = BPNN(input_size=8, hidden_size=4, output_size=1)
# 训练模型
mse, y_pred = model.train(X_train, y_train, epochs=10000)
# 预测测试集
y_pred_test = model.sigmoid(np.dot(model.W2, model.sigmoid(np.dot(model.W1, X_test.T) + model.b1)) + model.b2).T
# 计算MAE, MSE和相对误差平均百分比
mae = np.mean(np.abs(y_pred_test - y_test))
mse = np.mean((y_pred_test - y_test) ** 2)
error = np.mean(np.abs((y_pred_test - y_test) / y_test)) * 100
# 绘制R2图
plt.scatter(y_test, y_pred_test)
plt.plot([-3, 3], [-3, 3], 'r--')
plt.xlabel('True Value')
plt.ylabel('Predicted Value')
plt.title('R2')
plt.show()
# 绘制各输入输出的拟合折线图
for i in range(8):
plt.scatter(X_test[:, i], y_test)
plt.scatter(X_test[:, i], y_pred_test)
plt.xlabel(f'Input {i+1}')
plt.ylabel('Output')
plt.legend(['True', 'Predicted'])
plt.show()
print(f'MAE: {mae:.2f}')
print(f'MSE: {mse:.2f}')
print(f'Relative Error: {error:.2f}%')
```
需要注意的几点:
1. 在 BPNN 类中,我们定义了 sigmoid 函数和其导数 d_sigmoid 函数,用于激活和反向传播。
2. 在训练时,我们使用了均方误差作为损失函数。
3. 在更新权重时,我们使用了正则化项,以避免过拟合。
4. 在 main.py 中,我们首先读取了数据,并将其归一化。
5. 我们将前 2500 行作为训练集,后面的行作为测试集。
6. 我们使用了 BPNN 类来训练模型,并在测试集上进行预测。
7. 我们计算了 MAE、MSE 和相对误差平均百分比,并绘制了 R2 图和各输入输出的拟合折线图。
使用python创建一个使用归一化、Xavier初始化、正则化方法和MSGD的BP网络,该网络有8个输入1个输出1层隐藏层,要求分为两个模块(py文件),且一个是BP网络,另一个是主函数,在每句代码后添加注释;训练集数据存于xlsx表格前3000行中,测试集为之后的40行,且均为float类型,训练后模型不会出现shape类报错,。并且能够输出各输入的权重。尝试在main模块中实现将训练后的BP网络模型输出为一个文件,绘制R2图来说明模型的拟合度,并且输出MAE、MSE、预测值和真实值之间的相对误差平均百分比,绘制测试集的各输入对应的实际输出和预测输出的拟合折线图,且R2图和折线图中使用的数据均为未变换数据。
对于这个问题,需要进行以下几个步骤:
1.数据预处理:读取训练集和测试集数据,将其进行归一化处理。
2.初始化网络参数:使用Xavier初始化方法初始化权重和偏置。
3.定义网络结构:定义输入层、隐藏层和输出层的节点数,并且定义正则化方法。
4.定义损失函数:定义均方误差损失函数。
5.训练网络:使用MSGD优化器进行训练,得到训练后的模型。
6.输出权重:输出输入层和隐藏层之间的权重。
7.保存模型:将训练后的BP网络模型输出为一个文件。
8.绘制R2图和折线图:计算R2值和预测值和真实值之间的相对误差平均百分比,绘制拟合折线图。
下面是一个可能的实现:
1.数据预处理
```python
import pandas as pd
import numpy as np
# 读取训练集和测试集数据
train_data = pd.read_excel('data.xlsx', sheet_name='train', header=None)
test_data = pd.read_excel('data.xlsx', sheet_name='test', header=None)
# 将数据归一化处理
train_data_norm = (train_data - train_data.min()) / (train_data.max() - train_data.min())
test_data_norm = (test_data - test_data.min()) / (test_data.max() - test_data.min())
# 将数据转换为numpy数组
train_data_norm = train_data_norm.values
test_data_norm = test_data_norm.values
```
2.初始化网络参数
```python
# 使用Xavier初始化方法初始化权重和偏置
def xavier_init(size):
in_dim = size[0]
out_dim = size[1]
xavier_stddev = np.sqrt(2.0 / (in_dim + out_dim))
return np.random.normal(loc=0, scale=xavier_stddev, size=size)
# 初始化输入层到隐藏层之间的权重和偏置
input_size = 8
hidden_size = 10
output_size = 1
W1 = xavier_init((input_size, hidden_size))
b1 = np.zeros((1, hidden_size))
# 初始化隐藏层到输出层之间的权重和偏置
W2 = xavier_init((hidden_size, output_size))
b2 = np.zeros((1, output_size))
```
3.定义网络结构
```python
# 定义正则化方法
def regularization(W1, W2, lambd):
reg_term = (lambd / 2) * (np.sum(np.square(W1)) + np.sum(np.square(W2)))
return reg_term
# 定义输入层、隐藏层和输出层的节点数
input_size = 8
hidden_size = 10
output_size = 1
```
4.定义损失函数
```python
# 定义均方误差损失函数
def mse_loss(y, y_hat, W1, W2, lambd):
loss = np.mean(np.square(y - y_hat)) + regularization(W1, W2, lambd)
return loss
# 定义损失函数对输出值的导数
def mse_loss_gradient(y, y_hat):
return y_hat - y
```
5.训练网络
```python
# 使用MSGD优化器进行训练
def train(X, y, W1, b1, W2, b2, learning_rate=0.1, epochs=1000, lambd=0.1):
losses = []
for i in range(epochs):
# 前向传播
z1 = np.dot(X, W1) + b1
a1 = np.tanh(z1)
z2 = np.dot(a1, W2) + b2
y_hat = z2
# 计算损失函数
loss = mse_loss(y, y_hat, W1, W2, lambd)
losses.append(loss)
# 反向传播
dL_dy_hat = mse_loss_gradient(y, y_hat)
dL_dz2 = dL_dy_hat
dL_da1 = np.dot(dL_dz2, W2.T)
dL_dz1 = dL_da1 * (1 - np.tanh(z1) ** 2)
# 更新权重和偏置
dL_dW2 = np.dot(a1.T, dL_dz2)
dL_db2 = np.sum(dL_dz2, axis=0, keepdims=True)
dL_dW1 = np.dot(X.T, dL_dz1)
dL_db1 = np.sum(dL_dz1, axis=0, keepdims=True)
dL_dW2 += lambd * W2
dL_dW1 += lambd * W1
W2 -= learning_rate * dL_dW2
b2 -= learning_rate * dL_db2
W1 -= learning_rate * dL_dW1
b1 -= learning_rate * dL_db1
return W1, b1, W2, b2, losses
# 训练网络
X_train = train_data_norm[:, :-1]
y_train = train_data_norm[:, -1:]
W1, b1, W2, b2, losses = train(X_train, y_train, W1, b1, W2, b2, learning_rate=0.1, epochs=1000, lambd=0.1)
```
6.输出权重
```python
# 输出输入层到隐藏层之间的权重
print('Input layer to hidden layer weights:')
print(W1)
# 输出隐藏层到输出层之间的权重
print('Hidden layer to output layer weights:')
print(W2)
```
7.保存模型
```python
# 将训练后的BP网络模型输出为一个文件
np.savez('model.npz', W1=W1, b1=b1, W2=W2, b2=b2)
```
8.绘制R2图和折线图
```python
import matplotlib.pyplot as plt
# 定义计算R2值的函数
def r2_score(y_true, y_pred):
ss_res = np.sum(np.square(y_true - y_pred))
ss_tot = np.sum(np.square(y_true - np.mean(y_true)))
return 1 - (ss_res / ss_tot)
# 计算测试集的预测值和真实值
X_test = test_data_norm[:, :-1]
y_test_true = test_data_norm[:, -1:]
z1 = np.dot(X_test, W1) + b1
a1 = np.tanh(z1)
z2 = np.dot(a1, W2) + b2
y_test_pred = z2
# 计算R2值和相对误差平均百分比
r2 = r2_score(y_test_true, y_test_pred)
mae = np.mean(np.abs(y_test_true - y_test_pred))
mse = np.mean(np.square(y_test_true - y_test_pred))
rel_err = np.mean(np.abs((y_test_true - y_test_pred) / y_test_true)) * 100
# 输出R2值和相对误差平均百分比
print('R2 score:', r2)
print('MAE:', mae)
print('MSE:', mse)
print('Relative Error:', rel_err)
# 绘制拟合折线图
plt.plot(y_test_true, label='True Values')
plt.plot(y_test_pred, label='Predicted Values')
plt.legend()
plt.show()
```
这个实现中,我们将BP网络的训练、测试和保存模型的代码封装在了一个BPNet.py文件中,将主函数的代码放在了main.py文件中,并且从BPNet.py中导入BP网络模型。这样做可以提高代码的可读性和可维护性。
阅读全文