决策树python完整代码
时间: 2024-07-21 07:01:08 浏览: 75
决策树是一种常用的机器学习算法,用于分类和回归分析。在Python中,可以使用scikit-learn库来创建决策树模型。以下是一个简单的决策树完整代码示例,用于对鸢尾花数据集进行分类:
```python
# 导入所需的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train, y_train)
# 预测
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
# 可视化决策树(如果需要的话,可以使用如graphviz库)
# from sklearn.tree import export_graphviz
# import graphviz
# export_graphviz(clf, out_file='tree.dot', feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True)
# dot = graphviz.Source.from_dot_file('tree.dot')
# dot.view()
```
这个例子首先加载了鸢尾花数据,然后将数据分为训练集和测试集。接着,我们创建了一个`DecisionTreeClassifier`实例,并使用训练数据对其进行拟合。预测完成之后,我们计算并打印出预测的准确性。
如果你想要查看决策树的可视化结果,可以添加额外的步骤来生成图形文件(如上所示),但这不是必需的,因为实际运行时可能不会显示出来。
阅读全文