import numpy as np import pandas as pd import visuals as vs import seaborn as sns %matplotlib inline data = pd.read_csv('bj_housing.csv') print(data) missing = data.isnull().sum() print(missing) missing.sort_values(inplace=True,ascending=False) missing = missing[missing > 0] types = data[missing.index].dtypes percent = (data[missing.index].isnull().sum()/data[missing.index].isnull().count()).sort_values(ascending=False) missing_data = pd.concat([missing, percent,types], axis=1, keys=['Total', 'Percent','Types']) missing_data.sort_values('Total',ascending=False,inplace=True) missing_data
时间: 2024-04-02 19:33:32 浏览: 22
这段代码是用于读取北京房价数据集,并对数据集中的缺失值进行处理。
首先,使用pandas库中的read_csv()函数读取名为'bj_housing.csv'的数据集,并将读取的数据存储在名为data的DataFrame中。
然后,使用isnull()函数判断data中每个元素是否为缺失值,将结果存储在名为missing的Series中。接着,将missing中的元素按照从大到小的顺序排列,并将缺失值个数大于0的元素存储在missing中。
接下来,使用dtypes属性获取missing中每个缺失值所在列的数据类型,并将结果存储在名为types的Series中。接着,使用isnull()和sum()函数统计每一列缺失值的个数,并除以该列元素总数得到该列缺失值的比例,并将结果按照从大到小的顺序排列,存储在名为percent的Series中。
最后,使用concat()函数将missing、percent和types按照列方向拼接起来,形成一个新的DataFrame,存储在名为missing_data中,并将结果按照缺失值的个数从大到小排列。
相关问题
解释以下代码:import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns
这段代码的作用是导入Python数据分析和可视化的常用库,具体解释如下:
- `import pandas as pd`:导入pandas库,并将其命名为pd,以便在代码中使用更简短的名称来调用pandas的函数和方法。
- `import numpy as np`:导入numpy库,并将其命名为np,以便在代码中使用更简短的名称来调用numpy的函数和方法。
- `import matplotlib.pyplot as plt`:导入matplotlib库中的pyplot子库,并将其命名为plt,以便在代码中使用更简短的名称来调用matplotlib的可视化函数和方法。
- `%matplotlib inline`:这是一个Jupyter Notebook魔法命令,用于在Notebook中显示matplotlib图形。
- `import seaborn as sns`:导入seaborn库,它是一个基于matplotlib的数据可视化库,提供了更高级的统计图形和更美观的默认样式。同样,将其命名为sns以便在代码中使用更简短的名称来调用seaborn的函数和方法。
import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import numpy as np
import pandas as pd是Python中用于数据分析和处理的库,它提供了丰富的数据结构和数据分析工具。通过使用pd别名,我们可以方便地引用pandas库中的函数和类。
matplotlib.pyplot是Python中用于绘制图表和可视化数据的库。通过使用plt别名,我们可以方便地引用matplotlib.pyplot库中的函数和类。
%matplotlib inline是Jupyter Notebook中的魔术命令,它用于在Notebook中显示matplotlib绘制的图表。这个命令告诉Notebook将图表直接嵌入到输出单元格中,而不是弹出一个新窗口显示图表。
import numpy as np是导入NumPy库,NumPy是Python中用于科学计算的库,它提供了高性能的多维数组对象和各种数学函数。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)