import pandas as pd from keras.models import load_model from sklearn.preprocessing import MinMaxScaler # 加载已经训练好的kerasBP模型 model = load_model('D://model.h5') # 读取Excel文件中的数据 data = pd.read_excel('D://数据1.xlsx', sheet_name='4') # 对数据进行预处理,使其符合模型的输入要求 # 假设模型的输入是一个包含4个特征的向量 # 需要将Excel中的数据转换成一个(n, 4)的二维数组 X = data[['A', 'B', 'C', 'D']].values # 使用模型进行预测 y_pred = model.predict(X) scaler_y = MinMaxScaler(feature_range=(0, 4)) # 对预测结果进行反归一化 y_pred_int = scaler_y.inverse_transform(y_pred).round().astype(int) # 构建带有概率的预测结果 y_pred_prob = pd.DataFrame(y_pred_int, columns=data.columns[:4]) # 计算 mse y_test = data['y_true'].values mse = ((y_test - y_pred) ** 2).mean(axis=None) # 计算每个预测结果的概率并添加到 y_pred_prob 中 y_pred_prob['Probability'] = 1 / (1 + mse - ((y_pred_int - y_test) ** 2).mean(axis=None)) # 过滤掉和值超过6或小于6的预测值 y_pred_filtered = y_pred_prob[(y_pred_prob.iloc[:, :4].sum(axis=1) == 6)] # 去除重复的行 y_pred_filtered = y_pred_filtered.drop_duplicates() # 重新计算低于1.5的 Probability 值 low_prob_indices = y_pred_filtered[y_pred_filtered['Probability'] < 1.5].index for i in low_prob_indices: y_pred_int_i = y_pred_int[i] y_test_i = y_test[i] mse_i = ((y_test_i - y_pred_int_i) ** 2).mean(axis=None) new_prob_i = 1 / (1 + mse_i - ((y_pred_int_i - y_test_i) ** 2).mean(axis=None)) y_pred_filtered.at[i, 'Probability'] = new_prob_i # 打印带有概率的预测结果 print('Predicted values with probabilities:') print(y_pred_filtered)这段程序中错误是由于使用了尚未拟合的MinMaxScaler实例导致的。在使用scikit-learn中的任何转换器之前,都需要先使用fit方法进行拟合,以便转换器可以学习数据的范围和分布。你需要在调用inverse_transform方法之前使用fit方法对MinMaxScaler进行拟合,代码怎么修改
时间: 2024-02-12 16:04:36 浏览: 113
import pandas as pd.docx
您需要在对MinMaxScaler进行反归一化之前,先对其进行拟合。可以在X变量上使用fit方法对MinMaxScaler进行拟合,代码如下:
```
scaler_y = MinMaxScaler(feature_range=(0, 4))
scaler_y.fit(X)
```
在进行反归一化时,可以直接调用MinMaxScaler实例的inverse_transform方法,代码如下:
```
y_pred_int = scaler_y.inverse_transform(y_pred).round().astype(int)
```
完整代码如下:
```
import pandas as pd
from keras.models import load_model
from sklearn.preprocessing import MinMaxScaler
# 加载已经训练好的kerasBP模型
model = load_model('D://model.h5')
# 读取Excel文件中的数据
data = pd.read_excel('D://数据1.xlsx', sheet_name='4')
# 对数据进行预处理,使其符合模型的输入要求
# 假设模型的输入是一个包含4个特征的向量
# 需要将Excel中的数据转换成一个(n, 4)的二维数组
X = data[['A', 'B', 'C', 'D']].values
# 使用模型进行预测
y_pred = model.predict(X)
# 对预测结果进行反归一化
scaler_y = MinMaxScaler(feature_range=(0, 4))
scaler_y.fit(X)
y_pred_int = scaler_y.inverse_transform(y_pred).round().astype(int)
# 构建带有概率的预测结果
y_pred_prob = pd.DataFrame(y_pred_int, columns=data.columns[:4])
# 计算 mse
y_test = data['y_true'].values
mse = ((y_test - y_pred) ** 2).mean(axis=None)
# 计算每个预测结果的概率并添加到 y_pred_prob 中
y_pred_prob['Probability'] = 1 / (1 + mse - ((y_pred_int - y_test) ** 2).mean(axis=None))
# 过滤掉和值超过6或小于6的预测值
y_pred_filtered = y_pred_prob[(y_pred_prob.iloc[:, :4].sum(axis=1) == 6)]
# 去除重复的行
y_pred_filtered = y_pred_filtered.drop_duplicates()
# 重新计算低于1.5的 Probability 值
low_prob_indices = y_pred_filtered[y_pred_filtered['Probability'] < 1.5].index
for i in low_prob_indices:
y_pred_int_i = y_pred_int[i]
y_test_i = y_test[i]
mse_i = ((y_test_i - y_pred_int_i) ** 2).mean(axis=None)
new_prob_i = 1 / (1 + mse_i - ((y_pred_int_i - y_test_i) ** 2).mean(axis=None))
y_pred_filtered.at[i, 'Probability'] = new_prob_i
# 打印带有概率的预测结果
print('Predicted values with probabilities:')
print(y_pred_filtered)
```
阅读全文