eda探索性数据分析泰坦尼克
时间: 2024-01-04 16:00:54 浏览: 91
数据分析泰坦尼克数据集
EDA探索性数据分析是一种探索性数据分析方法,通过对数据进行可视化、统计和模式识别来发现数据的特征和规律。在泰坦尼克号数据集中,我们可以使用EDA来探索乘客的生存情况与各种因素之间的关系。
首先,我们可以通过绘制生存和死亡乘客的比例图来了解泰坦尼克号的生存情况。然后,我们可以进行性别和年龄等因素与生存情况的相关分析,比如绘制生存和死亡乘客的年龄分布直方图,以及生存和死亡乘客的性别比例图。接着,我们还可以通过绘制不同舱位等级和生存情况的柱状图来分析不同舱位等级对生存率的影响。除此之外,还可以探索家庭关系对生存率的影响,比如绘制有无兄弟姐妹或父母子女的乘客与生存情况的比例图。
通过以上的探索性数据分析,我们可以更清晰地了解泰坦尼克号乘客的生存情况与各种因素之间的关系,为后续的数据建模和预测工作提供重要的参考。因此,EDA探索性数据分析在泰坦尼克号数据集中具有非常重要的意义。
阅读全文