给出一个数据集决策树代码的例子
时间: 2024-12-16 21:20:54 浏览: 1
在Python中,我们可以使用sklearn库中的DecisionTreeClassifier类来创建决策树。这里提供一个简单的例子,假设我们有一个二分类的数据集,我们将演示如何使用决策树进行训练:
```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
import pandas as pd
# 加载 iris 数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 创建决策树分类器,默认最大深度是None,意味着由算法自动选择
clf = DecisionTreeClassifier()
# 使用训练集拟合模型
clf.fit(X_train, y_train)
# 预测测试集
predictions = clf.predict(X_test)
# 输出预测结果
print("Predictions:", predictions)
# 如果需要查看决策树结构,可以使用如下代码
# 它会生成一个可视化的树形图,展示决策过程
from sklearn.tree import export_graphviz
export_graphviz(clf, out_file="iris_tree.dot", feature_names=iris.feature_names, class_names=iris.target_names)
```
在这个例子中,我们首先加载数据,然后划分训练集和测试集,接着创建一个决策树分类器,并用训练数据对其进行训练。最后,我们预测测试集并打印预测结果。如果需要查看决策树的可视化,`export_graphviz`函数可用于导出图形文件。
阅读全文