如何使用sklearn中波士顿房价预测数据集
时间: 2024-05-11 11:14:55 浏览: 86
1. 导入数据集
首先,需要从sklearn.datasets中导入波士顿房价预测数据集。
``` python
from sklearn.datasets import load_boston
boston = load_boston()
```
2. 数据探索
接下来,可以使用以下代码对数据集进行探索:
``` python
# 查看数据集的描述性统计
print(boston.DESCR)
# 查看特征变量
print(boston.feature_names)
# 查看数据集的数据
print(boston.data)
# 查看目标变量
print(boston.target)
```
3. 数据预处理
在对数据进行建模之前,需要对数据进行预处理。可以使用以下代码进行标准化处理:
``` python
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(boston.data)
y = boston.target
```
4. 构建模型
接下来,可以使用以下代码构建一个线性回归模型:
``` python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X, y)
```
5. 模型测试
最后,可以使用以下代码对模型进行测试:
``` python
# 预测房价
y_pred = model.predict(X)
# 计算模型的R平方值
from sklearn.metrics import r2_score
print(r2_score(y, y_pred))
```
其中,R平方值用于衡量模型的拟合程度,值越接近1表示模型的拟合程度越好。
阅读全文