首页泰坦尼克号生存者数据集数据

泰坦尼克号生存者数据集数据

时间: 2023-07-06 08:22:15 浏览: 285

泰坦尼克号数据集(titanic)

泰坦尼克号数据集（机器学习基本数据集）。训练集应用于构建机器学习模型。对于训练集，我们为每位乘客提供结果。您的模型将基于“特征”，如乘客的性别和阶级。也可以使用特征工程来创建新特征。测试集应该用来查看模型在看不见的数据上的性能。

泰坦尼克号生存者数据集包含了以下信息： - PassengerId：乘客编号 - Survived：是否幸存（0表示未幸存，1表示幸存） - Pclass：船票等级（1表示一等舱，2表示二等舱，3表示三等舱） - Name：乘客姓名 - Sex：乘客性别 - Age：乘客年龄 - SibSp：船上兄弟姐妹/配偶的数量 - Parch：船上父母/子女的数量 - Ticket：船票号码 - Fare：船票价格 - Cabin：船舱号码 - Embarked：登船港口（C表示Cherbourg，Q表示Queenstown，S表示Southampton）其中，PassengerId、Name、Ticket和Cabin是唯一标识符，不具有预测意义。Survived是目标变量，需要进行预测。其他变量可以作为预测变量，用于训练模型。

阅读全文