使用逻辑回归训练模型(max_iter=10000)对泰坦尼克号乘客生存预测,输出预测结果
时间: 2024-01-21 16:16:42 浏览: 134
好的,需要先导入相关的库和数据集,代码如下:
```python
import pandas as pd
from sklearn.linear_model import LogisticRegression
# 读取数据集
data = pd.read_csv('titanic.csv')
# 数据预处理
data.drop(['PassengerId', 'Name', 'Ticket', 'Cabin'], axis=1, inplace=True)
data['Age'].fillna(data['Age'].mean(), inplace=True)
data['Embarked'].fillna('S', inplace=True)
data = pd.get_dummies(data, columns=['Sex', 'Embarked'])
# 划分训练集和测试集
train_data = data.iloc[:800]
test_data = data.iloc[800:]
# 训练模型
X_train = train_data.drop('Survived', axis=1)
y_train = train_data['Survived']
clf = LogisticRegression(max_iter=10000)
clf.fit(X_train, y_train)
# 预测结果
X_test = test_data.drop('Survived', axis=1)
y_test = test_data['Survived']
y_pred = clf.predict(X_test)
# 输出预测结果
print(y_pred)
```
这段代码会输出测试集上的预测结果。需要注意的是,这里使用了逻辑回归模型,并设置了最大迭代次数为10000。同时,对数据进行了预处理,包括删除一些无用的列、填充缺失值、进行独热编码等。最后划分数据集,训练模型并输出预测结果。
阅读全文