python统计每一列中空值,然后计算空值在一列中的占比,并以百分数进行输出
时间: 2024-02-11 21:05:58 浏览: 78
可以使用 pandas 库中的 DataFrame 来实现统计空值的功能,并使用 Python 的格式化字符串来输出占比百分数。
具体实现步骤如下:
1. 导入 pandas 库,读取数据文件并生成 DataFrame 对象。
```python
import pandas as pd
data = pd.read_csv('data.csv')
df = pd.DataFrame(data)
```
2. 使用 `isnull()` 函数统计每一列中的空值数量。
```python
null_count = df.isnull().sum()
```
3. 计算空值在一列中的占比,并将占比转换为百分数。
```python
null_percentage = null_count / len(df) * 100
null_percentage = ["{:.2f}%".format(x) for x in null_percentage]
```
4. 输出结果。
```python
for col, count, percentage in zip(df.columns, null_count, null_percentage):
print("列名:{},空值数量:{},空值占比:{}".format(col, count, percentage))
```
完整代码如下:
```python
import pandas as pd
data = pd.read_csv('data.csv')
df = pd.DataFrame(data)
null_count = df.isnull().sum()
null_percentage = null_count / len(df) * 100
null_percentage = ["{:.2f}%".format(x) for x in null_percentage]
for col, count, percentage in zip(df.columns, null_count, null_percentage):
print("列名:{},空值数量:{},空值占比:{}".format(col, count, percentage))
```
其中,'data.csv' 是数据文件的文件名,需要根据实际情况进行修改。
阅读全文