利用scikit-learn中的决策树分类器实现鸢尾花数据的分类,绘制出最终的树
时间: 2024-11-05 07:25:04 浏览: 5
机器学习基于python语言实现scikit-learn训练决策树分类器源码(可推理运算)+项目说明+详细注释.zip
在Python中,可以使用scikit-learn库中的`DecisionTreeClassifier`来实现鸢尾花数据集的分类。首先,需要导入所需的库并加载数据集。以下是一个简单的步骤:
1. 导入必要的库:
```python
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
```
2. 加载鸢尾花数据集:
```python
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
3. 数据预处理,将数据分为训练集和测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
4. 创建决策树分类器,并拟合数据:
```python
tree_classifier = DecisionTreeClassifier(random_state=42)
tree_classifier.fit(X_train, y_train)
```
5. 绘制决策树:
```python
plt.figure(figsize=(15, 10))
plot_tree(tree_classifier, filled=True, feature_names=iris.feature_names, class_names=iris.target_names)
plt.title("Final Decision Tree for Iris Classification")
plt.show()
```
这将展示一个决策树模型,表示了鸢尾花数据基于特征如何进行分类。
阅读全文