import pandas as pd import numpy as np from sklearn.linear_model import Ridge from sklearn.preprocessing import StandardScaler from sklearn.preprocessing import PolynomialFeatures from sklearn.model_selection import train_test_split # 读取 Excel 文件 data = pd.read_excel('D://数据1.xlsx', sheet_name='000') # 把数据分成输入和输出 X = data.iloc[:, 0:4].values y = data.iloc[:, 0:4].values # 标准化处理 scaler = StandardScaler() X = scaler.fit_transform(X) # 添加多项式特征 poly = PolynomialFeatures(degree=2, include_bias=False) X = poly.fit_transform(X) # 将数据分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0) # 创建岭回归模型, 加入L2正则化 model = Ridge(alpha=1, solver='auto', max_iter=1000, tol=0.001, random_state=None, # 加入L2正则化 fit_intercept=True) # 拟合模型 model.fit(X_train, y_train) # 使用模型进行预测 y_pred = model.predict(X_test) # 将预测结果四舍五入取整 y_pred = np.round(y_pred) # 去除重复行 y_pred = np.unique(y_pred, axis=0) # 打印预测结果 print(y_pred)在这段代码中加入模型集成:通过将多个模型进行集成,可以提高模型的表现
时间: 2024-02-19 12:03:48 浏览: 98
python数据分析与可视化 import pandas as pd import numpy as np import m
可以使用集成学习方法,如随机森林、梯度提升树等。这些方法可以在不同的子样本或特征子集上训练多个模型,然后将它们的预测结果进行投票或加权平均,得到最终的预测结果。以下是一个使用随机森林进行模型集成的示例代码:
```
from sklearn.ensemble import RandomForestRegressor
# 训练多个随机森林模型
models = []
for i in range(10):
model = RandomForestRegressor(n_estimators=100, max_depth=5, random_state=i)
model.fit(X_train, y_train)
models.append(model)
# 对测试集进行预测,并进行投票或加权平均
y_preds = []
for model in models:
y_pred = model.predict(X_test)
y_preds.append(y_pred)
y_pred_ensemble = np.round(np.mean(y_preds, axis=0))
# 打印集成模型的预测结果
print(y_pred_ensemble)
```
阅读全文