使用决策分类算法实现对鸢尾花数据集的分类
时间: 2023-08-31 10:10:12 浏览: 52
决策分类算法是一种基于决策树的分类方法,通过构建决策树来实现对数据集的分类。下面是使用决策分类算法实现对鸢尾花数据集的分类的步骤:
1. 导入数据集:使用Python的机器学习库Scikit-learn中的load_iris()函数导入鸢尾花数据集。
2. 划分训练集和测试集:使用train_test_split()函数将数据集划分为训练集和测试集。
3. 构建决策树模型:使用DecisionTreeClassifier()函数构建决策树模型,并设置树的最大深度。
4. 训练模型:使用fit()函数对决策树模型进行训练。
5. 预测结果:使用predict()函数对测试集进行预测,并计算预测准确率。
下面是使用Python代码实现对鸢尾花数据集的分类:
```
# 导入数据集
from sklearn.datasets import load_iris
iris = load_iris()
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
# 构建决策树模型
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(max_depth=3)
# 训练模型
clf.fit(X_train, y_train)
# 预测结果
y_pred = clf.predict(X_test)
# 计算预测准确率
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)
```
运行结果为:
```
准确率: 0.9777777777777777
```
可以看到,使用决策分类算法对鸢尾花数据集进行分类的准确率为97.8%。