pandas怎么查看显示出数据空值量和空值率并按表格的形式输出
时间: 2024-12-17 08:24:31 浏览: 29
在Pandas中,你可以使用`isnull()`函数检查数据框中的缺失值,然后结合`sum()`和`mean()`函数计算出空值的数量和比例。这里是一个简单的步骤:
1. 首先,对数据框应用`isnull()`操作,返回一个布尔型的数据框,其中`True`表示该位置有缺失值,`False`则代表非缺失值。
```python
df_null = df.isnull()
```
2. 接着,使用`sum()`函数计算每一列(包括行)中有多少缺失值,结果会是一个Series。
```python
null_counts = df_null.sum()
```
3. 计算空值率,可以将`sum()`的结果除以总行数,或者除以每列的有效非缺失值数量。这里我们假设数据框名为`df`,总行数可以用`df.shape[0]`得到。
```python
# 或者使用列的有效非缺失值数量,如果想保留百分比形式,记得转换为小数
null_rates = null_counts / df.shape[0]
```
4. 将计数和比率合并到一个新的DataFrame,可以方便地以表格形式展示:
```python
summary_df = pd.concat([null_counts.rename('Null Count'), null_rates.rename('Null Rate')], axis=1)
```
5. 最后,使用`transpose()`或`.T`将数据转置,以便按照列标题显示。
```python
result_table = summary_df.T
```
现在`result_table`就是一个包含原始数据空值数量和空值率的表格了。你可以直接打印这个DataFrame,或者将其保存为CSV、Excel等文件。
阅读全文