对鸢尾花数据进行C4.5,并计算准确率的Python代码
时间: 2023-06-27 18:03:40 浏览: 83
python利用c4.5决策树对鸢尾花卉数据集进行分类(iris)(代码全)
5星 · 资源好评率100%
C4.5是一种决策树算法,可以用于分类问题。下面是使用scikit-learn库实现对鸢尾花数据集进行C4.5决策树算法的Python代码,同时计算准确率:
```python
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3)
# 构建决策树模型
clf = DecisionTreeClassifier(criterion='entropy')
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
# 输出准确率
print("Accuracy:", accuracy)
```
在这个例子中,我们首先加载鸢尾花数据集,然后将数据集划分为训练集和测试集。接着,我们使用scikit-learn库中的DecisionTreeClassifier类构建C4.5决策树模型,并对训练集进行训练。最后,我们使用训练好的模型对测试集进行预测,并计算准确率。
阅读全文