Python 回归模型波士顿房价
时间: 2024-06-14 20:01:56 浏览: 108
波士顿房价预测 python
5星 · 资源好评率100%
波士顿房价数据集是经典的机器学习入门示例,它来自于1978年的哈佛大学统计系列中的" housing "数据集,由著名统计学家Hedibert L. Freeman提供。这个数据集包含了波士顿市区的房价信息以及与之相关的多个特征,如犯罪率、低收入家庭比例、平均房间数、学区质量等,常用于演示和实践线性回归模型。
在Python中,我们可以使用scikit-learn库来构建和分析波士顿房价的回归模型。以下是一个简单的例子:
```python
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 加载波士顿房价数据
boston = load_boston()
X = boston.data
y = boston.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测和评估
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
print(f"R-squared Score: {r2}")
# 可视化预测结果和真实值对比(如果有matplotlib)
import matplotlib.pyplot as plt
plt.scatter(y_test, y_pred)
plt.xlabel("True Prices")
plt.ylabel("Predicted Prices")
plt.show()
```
在这个例子中,我们首先加载数据,然后将数据分为训练集和测试集。接着,我们使用线性回归模型对房价进行预测,并计算了均方误差(MSE)和决定系数(R²)作为模型性能的指标。
如果你想要深入探讨,可以考虑以下几个问题:
1. 除了线性回归,还有哪些其他类型的回归模型可以用来分析波士顿房价数据?
2. 如何处理数据预处理步骤,例如缺失值和特征缩放?
3. 如何调整模型参数以优化预测效果?
阅读全文