用python的决策树算法预测泰坦尼克号的代码
时间: 2024-01-26 12:02:21 浏览: 80
基于泰坦尼克号数据的python实现
以下是用Python的决策树算法预测泰坦尼克号生还者的代码示例:
```python
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
# 读取训练数据集
train_data = pd.read_csv('train.csv')
# 定义特征列
features = ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']
# 处理缺失值
train_data[features].fillna(train_data[features].mean(), inplace=True)
# 特征向量化
dummies = [pd.get_dummies(train_data[feat], prefix=feat) for feat in features]
X = pd.concat(dummies, axis=1)
# 获取标签列
y = train_data['Survived']
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X, y)
# 读取测试数据集
test_data = pd.read_csv('test.csv')
# 处理缺失值
test_data[features].fillna(test_data[features].mean(), inplace=True)
# 特征向量化
dummies = [pd.get_dummies(test_data[feat], prefix=feat) for feat in features]
X_test = pd.concat(dummies, axis=1)
# 利用训练好的模型预测生还者
predicted = clf.predict(X_test)
# 输出预测结果
print(predicted)
```
注意:该代码只是示例,需要根据实际情况进行调整和改进。
阅读全文