泰坦尼克号生存数据特征处理,步骤 缺失值处理 对Embarked直接用众数填充; 对Fare用均值填充; 对Age,建立模型预测;
时间: 2024-06-12 16:07:36 浏览: 189
泰坦尼克号生存预测数据集.rar
1. 缺失值处理:对Embarked直接用众数填充;对Fare用均值填充;对Age,建立模型预测;
2. 对于Embarked缺失的数据,可以使用众数进行填充。查看Embarked的取值,发现最常见的取值是S,因此可以用S进行填充。
3. 对于Fare缺失的数据,可以使用均值进行填充。查看Fare的分布情况,发现Fare的分布呈现正态分布,因此可以使用均值进行填充。
4. 对于Age缺失的数据,可以建立模型进行预测。常用的预测模型包括线性回归、决策树、随机森林等。可以根据其他特征,如性别、舱位等,来建立模型进行预测。
阅读全文