用决策树编写一个泰坦尼克号生还预测树模型的可视化代码
时间: 2024-05-07 09:17:17 浏览: 12
好的,以下是使用Python的scikit-learn库编写的泰坦尼克号生还预测树模型的可视化代码:
```python
from sklearn import tree
import pandas as pd
import graphviz
# 加载数据
data = pd.read_csv('titanic.csv')
# 数据预处理
data = data.drop(['Name', 'Ticket', 'Cabin'], axis=1)
data['Sex'] = (data['Sex'] == 'male').astype(int)
data = data.dropna()
# 构建特征和目标变量
X = data.drop('Survived', axis=1)
y = data['Survived']
# 构建决策树模型
clf = tree.DecisionTreeClassifier(max_depth=3)
clf.fit(X, y)
# 可视化决策树模型
dot_data = tree.export_graphviz(clf, out_file=None,
feature_names=X.columns,
class_names=['Not Survived', 'Survived'],
filled=True, rounded=True)
graph = graphviz.Source(dot_data)
graph.render('titanic_tree')
```
该代码首先通过pandas库加载了名为“titanic.csv”的数据集,并对其进行了一些预处理。然后,使用scikit-learn库的决策树分类器构建了一个决策树模型,并将其拟合到训练数据中。最后,使用graphviz库将决策树模型可视化为图形,并将其保存为名为“titanic_tree”的文件。