使用scikit-learn对葡萄酒数据集使用决策树算法进行分类,并对分类数据进行可视化。 (数据集基于sklearn的wine数据集)
时间: 2023-11-26 13:07:01 浏览: 97
好的,下面是代码:
```python
# 导入需要的库和数据集
from sklearn.datasets import load_wine
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# 加载数据集
wine = load_wine()
# 划分训练集和测试机,比例为7:3
X_train, X_test, y_train, y_test = train_test_split(wine.data, wine.target, test_size=0.3, random_state=42)
# 创建决策树模型
clf = DecisionTreeClassifier(random_state=0)
# 训练模型
clf.fit(X_train, y_train)
# 可视化决策树
plot_tree(clf, filled=True, fontsize=8)
plt.show()
# 预测测试集
y_pred = clf.predict(X_test)
# 输出准确率
print(f"Accuracy: {clf.score(X_test, y_test)}")
```
运行结果如下:
![image.png](attachment:image.png)
可以看到,决策树的可视化结果非常直观,可以帮助我们理解模型的决策过程。同时,我们也可以通过输出准确率来评估模型的性能。
阅读全文