波士顿房价模型的主要步骤和代码是什么
时间: 2023-06-15 07:06:52 浏览: 172
基于线性回归的模型的波士顿房价预测.pdf
波士顿房价模型是一个经典的回归问题,主要步骤如下:
1. 数据读取与预处理:读取波士顿房价数据集,进行数据清洗、特征选择和标准化等预处理操作。
```
import numpy as np
from sklearn.datasets import load_boston
from sklearn.preprocessing import StandardScaler
# 读取数据集
boston = load_boston()
X, y = boston.data, boston.target
# 数据标准化
scaler = StandardScaler()
X = scaler.fit_transform(X)
```
2. 划分训练集和测试集:将数据集划分为训练集和测试集,一般采用 7:3 或 8:2 的比例。
```
from sklearn.model_selection import train_test_split
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
3. 模型训练和调参:选取合适的模型,并进行模型训练和调参。
```
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import GridSearchCV
# 定义回归模型和参数
models = {
"LinearRegression": LinearRegression(),
"RandomForestRegressor": RandomForestRegressor(),
}
params = {
"LinearRegression": {},
"RandomForestRegressor": {"n_estimators": [10, 50, 100, 200], "max_depth": [3, 5, 7, 9]},
}
# 模型训练和调参
for name, model in models.items():
grid = GridSearchCV(model, params[name], cv=5, scoring="neg_mean_squared_error")
grid.fit(X_train, y_train)
print(f"{name}: {grid.best_params_}, {grid.best_score_}")
```
4. 模型评估和预测:使用测试集对模型进行评估和预测,计算出模型的均方误差、均方根误差和 R 平方等指标,评估模型的表现。
```
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
# 模型评估
for name, model in models.items():
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"{name}: mse={mse:.2f}, mae={mae:.2f}, r2={r2:.2f}")
```
以上就是波士顿房价模型的主要步骤和代码。
阅读全文