用python统计excel表中没一栏的空值率,并在新excel中输出该excel表每栏的空值率
时间: 2024-09-07 15:00:50 浏览: 44
python从原Excel表中抽出数据存入同一文件的新的Sheet
要使用Python统计Excel表中每一列的空值率,并在新的Excel中输出这些信息,可以使用`pandas`库来实现。以下是具体的步骤和代码示例:
1. 首先,确保你已经安装了`pandas`和`openpyxl`库,如果没有安装,可以通过pip安装它们:
```
pip install pandas openpyxl
```
2. 使用`pandas`的`read_excel`函数读取原始Excel文件到DataFrame。
3. 利用DataFrame的`isnull()`方法生成一个布尔型DataFrame,表示原数据中的每个元素是否为null。
4. 使用`sum()`函数对布尔型DataFrame沿着行方向求和,然后除以原始数据的行数,得到每一列的空值率。
5. 将计算得到的空值率信息输出到一个新的Excel文件中。
下面是相应的Python代码:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('原始文件.xlsx')
# 计算每一列的空值率
null_rate = df.isnull().sum() / len(df)
# 输出每一列的空值率到新的Excel文件
null_rate.to_excel('空值率统计.xlsx')
```
这段代码假设你的Excel文件名为`原始文件.xlsx`,并且你想要将统计结果输出到名为`空值率统计.xlsx`的新Excel文件中。
阅读全文