用决策树和随机森林分析sklearn中的diabetes数据集的准确率的代码
时间: 2023-05-16 08:05:03 浏览: 95
以下是使用决策树和随机森林分析sklearn中的diabetes数据集的准确率的代码:
```python
from sklearn.datasets import load_diabetes
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载数据集
diabetes = load_diabetes()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(diabetes.data, diabetes.target, test_size=0.2, random_state=42)
# 决策树分类器
dtc = DecisionTreeClassifier()
dtc.fit(X_train, y_train)
dtc_pred = dtc.predict(X_test)
dtc_acc = accuracy_score(y_test, dtc_pred)
print("决策树准确率:", dtc_acc)
# 随机森林分类器
rfc = RandomForestClassifier()
rfc.fit(X_train, y_train)
rfc_pred = rfc.predict(X_test)
rfc_acc = accuracy_score(y_test, rfc_pred)
print("随机森林准确率:", rfc_acc)
```
注意:这里的diabetes数据集是一个回归问题,因此使用accuracy_score计算的是分类准确率,而不是回归问题中的R2分数。
阅读全文