泰坦尼克号生存预测代码
时间: 2023-09-26 20:09:39 浏览: 76
以下是使用 Python 语言和 Scikit-learn 库实现的泰坦尼克号生存预测代码示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 读取数据
data = pd.read_csv('train.csv')
# 特征选择
features = ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']
X = pd.get_dummies(data[features])
y = data['Survived']
# 数据集划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 模型训练
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
# 预测并评估模型
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
这个例子中,首先使用 Pandas 库读取了训练数据文件,并进行了特征选择。然后,使用 Scikit-learn 库中的 `train_test_split()` 方法将数据集划分为训练集和测试集。接着,使用决策树分类器进行模型训练,并使用测试集进行模型评估。最后,输出了模型的准确率。
阅读全文