使用python对字段issue进行决策树分类并可视化的代码
时间: 2024-02-05 17:05:24 浏览: 79
【代码分享】基于python的文本分类(sklearn-决策树和随机森林实现)
5星 · 资源好评率100%
以下是使用Python对字段issue进行决策树分类并可视化的示例代码:
```python
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import export_graphviz
import graphviz
# 读取数据集
data = pd.read_csv('data.csv')
# 分离特征和标签
X = data.drop('issue', axis=1)
y = data['issue']
# 创建决策树分类器并训练模型
clf = DecisionTreeClassifier(max_depth=3)
clf.fit(X, y)
# 可视化决策树
dot_data = export_graphviz(clf, out_file=None, feature_names=X.columns, class_names=['0', '1'], filled=True, rounded=True, special_characters=True)
graph = graphviz.Source(dot_data)
graph.render('decision_tree')
# 预测新数据
new_data = pd.DataFrame({'feature1': [1], 'feature2': [2], 'feature3': [3]})
prediction = clf.predict(new_data)
print(prediction)
```
在代码中,我们首先使用Pandas库读取数据集,然后分离特征和标签。接着,我们创建一个决策树分类器并训练模型。使用export_graphviz函数可视化决策树,其中feature_names参数是数据集的特征名称,class_names参数是数据集的标签名称。最后,我们使用render函数将决策树保存为PDF文件,并使用predict函数预测新的数据。
阅读全文