python中pandas删除有缺失值的行,并统计删除的行数占原始行数的百分比
时间: 2024-09-14 07:16:42 浏览: 47
白色大气风格的旅游酒店企业网站模板.zip
在Python中使用pandas库删除含有缺失值的行,可以通过`dropna()`函数实现。该函数提供了多种参数来控制删除缺失值的行或列。如果你想要删除任何含有缺失值的行,可以将`how`参数设置为`'any'`。然后,你可以计算原始数据框的行数和删除后的行数,从而得到删除的行数占原始行数的百分比。
以下是一个示例代码:
```python
import pandas as pd
# 假设df是你的pandas DataFrame
# df = pd.DataFrame(...)
# 删除含有缺失值的行
df_clean = df.dropna(how='any')
# 计算删除的行数占原始行数的百分比
deleted_percentage = ((df.shape[0] - df_clean.shape[0]) / df.shape[0]) * 100
# 输出结果
print(f"删除了{deleted_percentage:.2f}%的行")
```
在这段代码中,`df.shape[0]`是用来获取原始数据框`df`的行数,而`df_clean.shape[0]`是用来获取删除含有缺失值行后的数据框的行数。通过计算两者之间的差值并除以原始数据框的行数,再乘以100,我们得到一个百分比值。
阅读全文