titanic.isnull().sum

这行代码是用于检查 Titanic 数据集中每个列的缺失值数量。其中，`isnull()` 方法会对每个元素进行检查，如果该元素是缺失值，则返回 True，否则返回 False。然后，`sum()` 方法会对每列中的缺失值进行求和，得到该列中缺失值的数量。因此，`titanic.isnull().sum()` 的返回结果是一个 Series 对象，其中包含每列缺失值的数量。你可以使用这个结果来初步了解数据集中缺失值的情况，并根据需要对缺失值进行处理，比如删除缺失值、填充缺失值等。需要注意的是，这里的 `titanic` 对象应该是指已经读取到 DataFrame 中的数据集对象，如果你使用的是 `pdtitanic` 对象来读取数据集，那么正确的命令应该是 `pdtitanic.isnull().sum()`。

pdtitanic.isnull().sum()mean=titanic['age'].mean() print(mean) pdtitanic['age']=['age'].fillna(mean) pdtitanic.isnull().sum()

这段代码的作用如下： 1. 使用 `pdtitanic.isnull().sum()` 检查 Titanic 数据集中每个列的缺失值数量。 2. 使用 `mean=titanic['age'].mean()` 计算 Titanic 数据集中乘客年龄 `age` 列的平均值，并将结果保存到 `mean` 变量中。 3. 使用 `pdtitanic['age']=['age'].fillna(mean)` 将 `age` 列中的缺失值用平均值进行填充。 4. 再次使用 `pdtitanic.isnull().sum()` 检查填充后的数据集中每个列的缺失值数量。需要注意的是，这段代码中存在一些错误： 1. 在第一行代码中，应该使用 `pdtitanic` 对象来检查缺失值数量，而不是 `titanic` 对象。因此，正确的命令应该是 `pdtitanic.isnull().sum()`。 2. 在第三行代码中，`['age']` 应该去掉，否则会出现语法错误。正确的代码应该是 `pdtitanic['age'].fillna(mean)`。正确的代码如下： ``` # 检查原始数据中的缺失值数量 print(pdtitanic.isnull().sum()) # 计算乘客年龄的平均值 mean = pdtitanic['age'].mean() print(mean) # 将 age 列中的缺失值用平均值进行填充 pdtitanic['age'].fillna(mean, inplace=True) # 检查填充后的数据中的缺失值数量 print(pdtitanic.isnull().sum()) ``` 注意，为了在原始数据集中进行修改，需要使用 `inplace=True` 参数来指定对原始数据进行修改，否则会得到一个新的 DataFrame 对象。

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus']=False %matplotlib inline pdtitanic = pd.read_csv(r"C:\Users\小杜羽\Desktop\titanic.csv") pdtitanic.head() pdtitanic.isnull().sum() mean=titanic['age'].mean() print(mean) pdtitanic['age']=['age'].fillna(mean) pdtitanic.isnull().sum() sns.distplot(titanic["age"]) titanic["embarked"],value_counts() del titanic.['deck'] titanic.head sns.countplot(x="sex",data=titanic) sns.boxplot(x="sex",y="age",data=titanic) sns.countplot(x="class",data=titanic) sns.violinplot(y="age",x="class",data=titanic) def agelevel(age): if age<=16: return'child' elif age>=60: return'old' else: return'middle' titanic['age_level']=titanic['age'].map(agelevel) titanic.head sns.countplot(x='age_level',data=titanic) sns.countplot(x='alive',hue='age_level',data=titanic) plt.legend(loc='best',fontsize='15')

你的代码中有一些错误，我来帮你看看： 1. 在导入数据时，你使用了`pdtitanic`变量，但是后面的代码中却使用了`titanic`变量，需要统一变量名。 2. 在填充年龄缺失值时，使用了字符串而不是变量名，应该改为`pdtitanic['age']=pdtitanic['age'].fillna(mean)`。 3. 在查看`embarked`列的取值时，应该使用`pdtitanic["embarked"].value_counts()`。 4. 在删除`deck`列时，需要在`del`和列名之间加上一个"."，即`del titanic['deck']`。 5. 在查看`age_level`列的取值时，需要在`titanic.head`后面加上一个括号，即`titanic.head()`。 6. 在画`countplot`时，需要在`plt.legend`前面加上`sns.`，即`sns.countplot(x='alive',hue='age_level',data=titanic) plt.legend(loc='best',fontsize='15')`。修改后的代码如下所示： ```python import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus']=False %matplotlib inline titanic = pd.read_csv(r"C:\Users\小杜羽\Desktop\titanic.csv") titanic.head() titanic.isnull().sum() mean = titanic['age'].mean() print(mean) titanic['age'] = titanic['age'].fillna(mean) titanic.isnull().sum() sns.distplot(titanic["age"]) print(titanic["embarked"].value_counts()) del titanic['deck'] sns.countplot(x="sex",data=titanic) sns.boxplot(x="sex",y="age",data=titanic) sns.countplot(x="class",data=titanic) sns.violinplot(y="age",x="class",data=titanic) def agelevel(age): if age<=16: return 'child' elif age>=60: return 'old' else: return 'middle' titanic['age_level'] = titanic['age'].map(agelevel) titanic.head() sns.countplot(x='age_level',data=titanic) sns.countplot(x='alive',hue='age_level',data=titanic) sns.legend(loc='best',fontsize='15') ```

阅读全文

titanic.isnull().sum

pdtitanic.isnull().sum()mean=titanic['age'].mean() print(mean) pdtitanic['age']=['age'].fillna(mean) pdtitanic.isnull().sum()

相关推荐

titanic.csv

titanic.csv泰坦尼克号人员数据集

titaniccsv.zip_Titanic.csv_kaggle数据集_titanic训练集_train.csv_train.

泰坦尼克tatanic.isnull().sum()

对titanic_train.csv进行确实值处理，使用jupyter

对titanic_train.csv采用sklearn 包进行批量统计填充，

python填充缺失值titanic

导入‘titanic’数据集，查找缺失值，并删除无效行与列，并分别打印出删除前后的大小。

BS23-287基于Python的期货程序化交易系统的设计与实现-206jhypi.zip

springboot052基于Springboot+Vue旅游管理系统毕业源码案例设计.zip

Matlab实现牛顿拉夫逊优化算法NRBO-Kmean-Transformer-BiLSTM负荷预测算法研究.rar

【创新未发表】Matlab实现樽海鞘优化算法SSA-GRU实现风电数据预测算法研究.rar

最新推荐

BS23-287基于Python的期货程序化交易系统的设计与实现-206jhypi.zip

springboot052基于Springboot+Vue旅游管理系统毕业源码案例设计.zip

Matlab实现牛顿拉夫逊优化算法NRBO-Kmean-Transformer-BiLSTM负荷预测算法研究.rar

【创新未发表】Matlab实现樽海鞘优化算法SSA-GRU实现风电数据预测算法研究.rar

基于向量加权平均算法INFO-Kmean-Transformer-GRU实现数据回归预测算法研究Matlab代码.rar

Android圆角进度条控件的设计与应用

管理建模和仿真的文件

【R语言lattice包实战】：从案例到技巧，图形制作不再难

输入正整数n.打出长度为n的菱形

mui框架实现带侧边栏的响应式布局