应用sklearn中的决策树回归函数对波士顿房价预测数据集进行学习和测试,并计算测试集上的平均绝对误差。
时间: 2024-09-24 15:24:22 浏览: 45
在Python的scikit-learn库中,可以使用`DecisionTreeRegressor`类来创建决策树回归模型,用于预测波士顿房价数据集。这个数据集通常包含了14种特征,如犯罪率、住宅年龄等,目标变量是每个区的房屋价格。
首先,你需要加载所需的库并导入数据:
```python
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_absolute_error
# 加载波士顿房价数据集
boston = load_boston()
X = boston.data
y = boston.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
然后,你可以建立模型并进行训练:
```python
# 创建决策树回归模型
regressor = DecisionTreeRegressor()
# 训练模型
regressor.fit(X_train, y_train)
```
接下来,使用训练好的模型进行预测,并计算测试集的平均绝对误差(MAE):
```python
# 预测测试集
y_pred = regressor.predict(X_test)
# 计算平均绝对误差
mae = mean_absolute_error(y_test, y_pred)
print("测试集上的平均绝对误差: ", mae)
```
这将输出测试集上决策树回归模型的预测性能指标,平均绝对误差越小,说明模型的预测精度越高。
阅读全文