keras泰坦尼克号存活率的预测代码
时间: 2024-04-05 18:23:39 浏览: 144
基于tensorflow编写使用keras进行训练的对泰坦尼克号旅客的生存率进行预测的机器学习项目+源代码+文档说明
以下是使用Keras预测泰坦尼克号存活率的示例代码:
```
import pandas as pd
from keras.models import Sequential
from keras.layers import Dense
# 读取数据集
data = pd.read_csv("titanic.csv")
# 填充缺失值
data.fillna(0, inplace=True)
# 构建特征和标签
X = data.drop("Survived", axis=1)
y = data["Survived"]
# 构建模型
model = Sequential()
model.add(Dense(8, input_dim=X.shape[1], activation="relu"))
model.add(Dense(4, activation="relu"))
model.add(Dense(1, activation="sigmoid"))
# 编译模型
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["accuracy"])
# 训练模型
model.fit(X, y, epochs=100, batch_size=32)
# 预测新数据
new_data = pd.DataFrame([[3, "male", 22, 1, 0, 7.25, "S"]], columns=["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked"])
new_data["Sex"].replace({"male": 0, "female": 1}, inplace=True)
new_data["Embarked"].replace({"S": 0, "C": 1, "Q": 2}, inplace=True)
new_data.fillna(0, inplace=True)
prediction = model.predict(new_data)
# 打印预测结果
print(prediction)
```
这个模型使用神经网络来预测泰坦尼克号乘客的生存率。输入特征包括乘客的船舱等级、性别、年龄、同行兄弟姐妹/配偶数量、同行父母/小孩数量、船票价格和登船港口。输出值是一个概率,表示乘客生还的可能性。
阅读全文