利用CART决策树对iris数据集进行分类。训练数据集占原数据集的90%,剩余的为测试数据集。画出决策树模型后评估模型准确率。
时间: 2023-12-29 21:03:03 浏览: 80
好的,下面是利用 CART 决策树对 iris 数据集进行分类的步骤:
1. 导入必要的库
```
import pandas as pd
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
```
2. 加载 iris 数据集
```
iris_data = pd.read_csv('iris.csv')
```
3. 将数据集分为特征和目标变量
```
X = iris_data.drop('species', axis=1)
y = iris_data['species']
```
4. 将数据集分为训练集和测试集
```
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)
```
5. 实例化决策树分类器
```
clf = DecisionTreeClassifier()
```
6. 训练模型
```
clf.fit(X_train, y_train)
```
7. 预测测试集的结果
```
y_pred = clf.predict(X_test)
```
8. 计算模型的准确率
```
accuracy = accuracy_score(y_test, y_pred)
```
9. 打印模型的准确率
```
print("模型准确率为:", accuracy)
```
10. 可视化决策树模型
```
plot_tree(clf, filled=True)
```
以上是利用 CART 决策树对 iris 数据集进行分类的完整步骤。其中,第4步中将测试集占比改为了10%,因为数据集较小,为了保证测试集的样本量足够,可以适当减小测试集的占比。
阅读全文