使用决策树模型预测sklearn官方diabetes(糖尿病)数据集的目标值。
时间: 2023-08-11 22:07:54 浏览: 240
好的,我可以帮你解答这个问题。
首先,我们需要加载sklearn官方diabetes数据集,并将其分为训练集和测试集。这样可以在训练集上训练决策树模型,在测试集上测试模型的性能。
以下是代码示例:
```python
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
# 加载数据集
diabetes = load_diabetes()
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(diabetes.data, diabetes.target, test_size=0.2, random_state=42)
```
接下来,我们需要创建一个决策树模型,并使用训练集对其进行训练。在创建模型时,我们可以指定一些超参数,例如决策树的最大深度、最小样本拆分等。
以下是代码示例:
```python
from sklearn.tree import DecisionTreeRegressor
# 创建决策树模型
tree = DecisionTreeRegressor(max_depth=3, min_samples_split=5, random_state=42)
# 在训练集上训练决策树模型
tree.fit(X_train, y_train)
```
最后,我们可以使用测试集评估模型的性能,并计算模型的均方误差(MSE)和决定系数(R²)。
以下是代码示例:
```python
from sklearn.metrics import mean_squared_error, r2_score
# 在测试集上测试决策树模型
y_pred = tree.predict(X_test)
# 计算均方误差和决定系数
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print("MSE:", mse)
print("R²:", r2)
```
希望这个代码示例能够帮助你理解如何使用决策树模型预测sklearn官方diabetes数据集的目标值。
阅读全文