鸢尾花数据集决策树模型的可视化图实现
时间: 2024-10-14 17:17:37 浏览: 0
鸢尾花数据集(Iris dataset)是一个经典的机器学习数据集,主要用于分类任务。使用决策树模型对这个数据集建模后,可视化的图可以帮助我们理解模型如何基于特征进行预测。在Python中,我们可以利用`scikit-learn`库中的`DecisionTreeClassifier`和`plot_tree`函数,以及`matplotlib`库来创建决策树的可视化。
首先,你需要导入所需的库并加载数据:
```python
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
```
然后,你可以通过以下代码生成并显示决策树:
```python
plt.figure(figsize=(25, 10))
tree.plot_tree(clf, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
plt.show()
```
这将输出一张详细的决策树图表,展示每个内部节点的特征、阈值和子节点,以及叶子节点对应的类别预测。