实现波士顿房价预测问题的建模与训练的代码,完整代码
时间: 2023-11-22 20:52:16 浏览: 35
以下是波士顿房价预测问题的完整代码:
```python
# 导入必要的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 加载波士顿房价数据集
boston = load_boston()
# 将数据集转换为 pandas DataFrame 格式
df = pd.DataFrame(boston.data, columns=boston.feature_names)
# 添加目标变量
df['MEDV'] = boston.target
# 分割数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(df[boston.feature_names], df['MEDV'], test_size=0.2, random_state=42)
# 使用线性回归模型进行训练
lr = LinearRegression()
lr.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = lr.predict(X_test)
# 计算均方误差和决定系数
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
# 输出结果
print('均方误差:', mse)
print('决定系数:', r2)
# 绘制预测值与真实值的散点图
plt.scatter(y_test, y_pred)
plt.xlabel('True Values')
plt.ylabel('Predictions')
plt.show()
```
运行代码即可得到预测结果。需要注意的是,由于数据集已经包含了目标变量,因此不需要进行额外的数据清洗和预处理。