波士顿房价预测线性回归
时间: 2023-08-31 22:09:52 浏览: 102
波士顿房价预测是一个经典的回归问题,常用的方法包括线性回归、决策树、随机森林等。这里我们以线性回归为例来预测房价。
首先,我们需要载入数据集,可以使用 sklearn 中的 load_boston() 函数来加载波士顿房价数据集。
```python
from sklearn.datasets import load_boston
boston = load_boston()
X = boston.data
y = boston.target
```
接着,我们将数据集分为训练集和测试集,并进行标准化处理,这一步是为了让特征值在相同的尺度上。
```python
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
```
然后,我们可以使用线性回归模型来拟合数据,并进行预测。
```python
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
lr = LinearRegression()
lr.fit(X_train, y_train)
y_pred_train = lr.predict(X_train)
y_pred_test = lr.predict(X_test)
mse_train = mean_squared_error(y_train, y_pred_train)
mse_test = mean_squared_error(y_test, y_pred_test)
print("训练集 MSE:", mse_train)
print("测试集 MSE:", mse_test)
```
最后,我们可以通过评价指标(如均方误差)来评估模型的性能。如果测试集的误差过大,说明模型存在欠拟合或过拟合的问题,需要进行调参或者使用其他更复杂的模型。
阅读全文