sklearn 波士顿房价预测 对模型进行评估、预测和可视化
时间: 2024-09-29 11:04:50 浏览: 39
在scikit-learn库中,波士顿房价预测是一个经典的应用案例,通常用于初学者入门机器学习。首先,你需要加载波士顿房价数据集,该数据集包含了506个观察值和14种特征。
1. **数据加载**:
```python
from sklearn.datasets import load_boston
boston = load_boston()
X = boston.data
y = boston.target
```
2. **数据预处理**:
对数据进行归一化或标准化,以便更好地训练模型:
```python
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
```
3. **模型选择与训练**:
例如,你可以选择线性回归(LinearRegression)作为基础模型:
```python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_scaled, y)
```
4. **模型评估**:
通过交叉验证(如`cross_val_score`)或计算均方误差(MSE)、R²分数等指标来评估模型性能:
```python
from sklearn.model_selection import cross_val_score
scores = cross_val_score(model, X_scaled, y, cv=5)
print("平均得分:", scores.mean())
```
5. **预测**:
对新数据进行预测:
```python
new_data = ... # 新的数据点
predicted_price = model.predict(new_data.reshape(1, -1))
```
6. **结果可视化**:
可以使用matplotlib将房价与某些特征的关系画成散点图,比如特征与实际价格的关系:
```python
import matplotlib.pyplot as plt
plt.scatter(boston.feature_names, y, color='blue')
plt.xlabel('Feature')
plt.ylabel('Price')
plt.show()
```
阅读全文