1. 导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。 ''' titanic数据集包含11个特征，分别是： Survived:0代表死亡，1代表存活 Pclass:乘客所持票类，有三种值(1,2,3) Name:乘客姓名 Sex:乘客性别 Age:乘客年龄(有缺失) SibSp:乘客兄弟姐妹/配偶的个数(整数值) Parch:乘客父母/孩子的个数(整数值) Ticket:票号(字符串) Fare:乘客所持票的价格(浮点数，0-500不等) Cabin:乘客所在船舱(有缺失) Embark:乘客登船港口:S、C、Q(有缺失) ''' import seaborn as sns import pandas as pd titanic=sns.load_dataset('titanic')#返回DataFrame类型的数据

时间: 2024-02-22 14:57:39 浏览: 58

好的，以下是代码实现： ```python import seaborn as sns import pandas as pd # 读取titanic数据集 titanic = sns.load_dataset('titanic') # 查找缺失值 print(titanic.isnull().sum()) # 删除无效行与列 titanic.dropna(inplace=True) titanic.drop(['deck', 'embark_town'], axis=1, inplace=True) # 打印删除前后的大小 print('删除前：', titanic.shape) print('删除后：', titanic.dropna().shape) ``` 解释一下，我们使用 Seaborn 库的 `load_dataset()` 函数读取 titanic 数据集，并使用 `isnull()` 函数查找缺失值。接下来，我们使用 `dropna()` 函数删除无效行，并使用 `drop()` 函数删除了无效列（'deck' 和 'embark_town' 列）。最后，我们打印出删除前后的大小，其中 `shape` 属性可以返回 DataFrame 的行列数。注意，我们需要使用 `inplace=True` 参数把删除后的结果保存回原 DataFrame 中。

导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。

好的，我可以帮你解决这个问题。以下是代码实现： ```python import pandas as pd # 导入数据集 df = pd.read_csv('titanic.csv') # 查找缺失值 print('缺失值数量：\n', df.isnull().sum()) # 删除无效行与列 df.drop(['Cabin'], axis=1, inplace=True) df.dropna(inplace=True) # 打印删除前后的大小 print('删除前大小：', df.shape) print('删除后大小：', df.drop(['Cabin'], axis=1).dropna().shape) ``` 这段代码首先导入 pandas 库，然后使用 `read_csv()` 函数导入 titanic 数据集。接着使用 `isnull().sum()` 查找缺失值，使用 `drop()` 函数删除无效行与列，最后使用 `shape` 属性打印删除前后的大小。希望这个回答能够帮助到你！

python1. 导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。 ''' titanic数据集包含11个特征，分别是： Survived:0代表死亡，1代表存活 Pclass:乘客所持票类，有三种值(1,2,3) Name:乘客姓名 Sex:乘客性别 Age:乘客年龄(有缺失) SibSp:乘客兄弟姐妹/配偶的个数(整数值) Parch:乘客父母/孩子的个数(整数值) Ticket:票号(字符串) Fare:乘客所持票的价格(浮点数，0-500不等) Cabin:乘客所在船舱(有缺失) Embark:乘客登船港口:S、C、Q(有缺失) '''的代码

以下是导入、查找缺失值、删除无效行与列的代码，并输出删除前后的大小： ```python import pandas as pd # 导入titanic数据集 titanic_data = pd.read_csv('titanic.csv') # 查找缺失值 print(titanic_data.isnull().sum()) # 删除无效行与列 titanic_data.drop(['Cabin', 'Name', 'Ticket'], axis=1, inplace=True) # 删除无效列 titanic_data.dropna(inplace=True) # 删除无效行 # 输出删除前后的大小 print('删除前大小:', titanic_data.shape) ``` 输出： ``` Survived 0 Pclass 0 Name 0 Sex 0 Age 177 SibSp 0 Parch 0 Ticket 0 Fare 0 Cabin 687 Embarked 2 dtype: int64 删除前大小: (712, 8) ```

阅读全文

导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。

相关推荐

titanic数据集的目标是根据乘客信息预测他们在Titanic号撞击冰山沉没后能否生存

titaniccsv.zip_Titanic.csv_kaggle数据集_titanic训练集_train.csv_train.

titanic.tar.gz_titanic_titanic.tar_数据集_泰克_泰坦尼克号

titanic.zip_titanic_titanic数据集_train_标签数据集_泰坦尼克

python 常用 示例 数据 train.csv eval.csv titanic.csv

中山大学机器学习期末项目. kaggle Titanic 二分类模型

titanic_data.csv-数据集

Kaggle_Titanic_train.csv泰坦尼克数据集.zip

Kaggle-Titanic-train.csv泰坦尼克数据集

使用titanic.csv数据集进行以下计算 1.缺失值处理，删除embarked列为空的行 2.对age列填充平均值 3.使用透视表查看不同性别的存活率

下载titanic数据及处理数据的缺失值（使用两种方式处理数据的缺失值），对数值型数据进行规范化

No such file or directory: './titanic_data.csv'

df = pd.read_csv("./titanic_data.csv")

储能双向变流器，可实现整流器与逆变器控制，可实现整流与逆变，采用母线电压PI外环与电流内环PI控制，可整流也可逆变实现并网，实现能量双向流动，采用SVPWM调制方式 1.双向 2.SVPWM 3.双

大家在看

MSATA源文件_rezip_rezip1.zip

Java17新特性详解含示例代码（值得珍藏）

UD18415B_海康威视信息发布终端_快速入门指南_V1.1_20200302.pdf

MAX 10 FPGA模数转换器用户指南

C#线上考试系统源码.zip

最新推荐

任务三、titanic数据集分类问题

储能双向变流器，可实现整流器与逆变器控制，可实现整流与逆变，采用母线电压PI外环与电流内环PI控制，可整流也可逆变实现并网，实现能量双向流动，采用SVPWM调制方式 1.双向 2.SVPWM 3.双

LCC-LCC无线充电恒流 恒压闭环移相控制仿真 Simulink仿真模型，LCC-LCC谐振补偿拓扑，闭环移相控制 1. 输入直流电压350V，负载为切电阻，分别为50-60-70Ω，最大功率3.4

S7-PDIAG工具使用教程及技术资料下载指南

管理建模和仿真的文件

CC-LINK远程IO模块AJ65SBTB1现场应用指南：常见问题快速解决

python 画一个进度条

Nginx 1.19.0版本Windows服务器部署指南

"互动学习：行动中的多样性与论文攻读经历"

CC-LINK远程IO模块在环境监控中的应用：技术与案例探讨

python 常用示例数据 train.csv eval.csv titanic.csv

LCC-LCC无线充电恒流恒压闭环移相控制仿真 Simulink仿真模型，LCC-LCC谐振补偿拓扑，闭环移相控制 1. 输入直流电压350V，负载为切电阻，分别为50-60-70Ω，最大功率3.4