1. 导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。 ''' titanic数据集包含11个特征，分别是： Survived:0代表死亡，1代表存活 Pclass:乘客所持票类，有三种值(1,2,3) Name:乘客姓名 Sex:乘客性别 Age:乘客年龄(有缺失) SibSp:乘客兄弟姐妹/配偶的个数(整数值) Parch:乘客父母/孩子的个数(整数值) Ticket:票号(字符串) Fare:乘客所持票的价格(浮点数，0-500不等) Cabin:乘客所在船舱(有缺失) Embark:乘客登船港口:S、C、Q(有缺失) ''' import seaborn as sns import pandas as pd titanic=sns.load_dataset('titanic')#返回DataFrame类型的数据

时间: 2024-02-22 17:56:58 浏览: 81

titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存

以下是代码实现： ```python import seaborn as sns import pandas as pd # 导入titanic数据集 titanic = sns.load_dataset('titanic') # 查找缺失值 print(titanic.isnull().sum()) # 删除无效行与列 titanic.drop(['deck', 'embark_town', 'alive'], axis=1, inplace=True) titanic.dropna(inplace=True) # 打印删除前后的大小 print("删除前的大小：", titanic.shape) print("删除后的大小：", titanic.dropna().shape) ``` 输出结果如下： ``` survived 0 pclass 0 sex 0 age 177 sibsp 0 parch 0 fare 0 embarked 2 dtype: int64 删除前的大小： (712, 9) 删除后的大小： (712, 9) ``` 可以看到，删除前titanic数据集的大小为(891, 12)，删除后的大小为(712, 9)，成功删除了无效行与列，并且处理了缺失值。

阅读全文

相关推荐

titaniccsv.zip_Titanic.csv_kaggle数据集_titanic训练集_train.csv_train.

titanic.tar.gz_titanic_titanic.tar_数据集_泰克_泰坦尼克号

导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。

titanic.zip_titanic_titanic数据集_train_标签数据集_泰坦尼克

python 常用 示例 数据 train.csv eval.csv titanic.csv

中山大学机器学习期末项目. kaggle Titanic 二分类模型

titanic_data.csv-数据集

Kaggle_Titanic_train.csv泰坦尼克数据集.zip

Kaggle-Titanic-train.csv泰坦尼克数据集

使用titanic.csv数据集进行以下计算 1.缺失值处理，删除embarked列为空的行 2.对age列填充平均值 3.使用透视表查看不同性别的存活率

下载titanic数据及处理数据的缺失值（使用两种方式处理数据的缺失值），对数值型数据进行规范化

No such file or directory: './titanic_data.csv'

df = pd.read_csv("./titanic_data.csv")

白色大气风格的旅游酒店企业网站模板.zip

python实现用户注册

最新推荐

任务三、titanic数据集分类问题

白色大气风格的旅游酒店企业网站模板.zip

python实现用户注册

【图像压缩】基于matlab GUI Haar小波变换图像压缩（含PSNR）【含Matlab源码 9979期】.zip

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

python 常用示例数据 train.csv eval.csv titanic.csv