添加可视化决策树的代码
时间: 2024-02-26 08:09:40 浏览: 18
以下是一个使用决策树算法预测宫颈癌并可视化决策树的Python代码示例:
```
import pandas as pd
from sklearn.tree import DecisionTreeClassifier, export_graphviz
from sklearn.model_selection import train_test_split
from sklearn import metrics
from IPython.display import Image
import pydotplus
# 读取数据集
data = pd.read_csv("cervical_cancer.csv")
# 获取特征和目标变量
X = data.drop('cancer', axis=1)
y = data['cancer']
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)
# 创建决策树模型
clf = DecisionTreeClassifier()
# 训练模型
clf = clf.fit(X_train,y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 评估模型
print("Accuracy:",metrics.accuracy_score(y_test, y_pred))
# 可视化决策树
dot_data = export_graphviz(clf, out_file=None,
feature_names=list(X.columns.values),
class_names=['0', '1'],
filled=True, rounded=True,
special_characters=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())
```
其中,除了前面的代码和预测模型评估部分外,我们在最后添加了可视化决策树的代码。使用sklearn库中的export_graphviz函数来将决策树输出为Graphviz格式的dot文件,然后使用pydotplus库将其转换为PNG图像并在IPython Notebook中显示。在export_graphviz函数中,我们需要指定特征名称、类别名称和其他一些参数,以便正确地绘制决策树。