pandas的dropna
时间: 2024-02-15 17:00:45 浏览: 56
详解pandas删除缺失数据(pd.dropna()方法)
pandas的dropna是一个用于删除DataFrame或Series中包含缺失值的行或列的函数。它可以帮助我们处理数据中的缺失值,使得数据更加完整和准确。
dropna函数有一些常用的参数,下面是一些常见的用法:
1. axis:指定删除行还是列,默认为0,表示删除包含缺失值的行;如果设置为1,则表示删除包含缺失值的列。
2. how:指定删除的方式,默认为any,表示只要有一个缺失值就删除整行或整列;如果设置为all,则表示只有全部为缺失值时才删除。
3. subset:指定删除缺失值的范围,默认为None,表示删除整个DataFrame或Series中的缺失值;如果设置为一个列表,可以指定删除某些列或某些行中的缺失值。
下面是一个示例:
```python
import pandas as pd
# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, None, 4],
'B': [5, None, 7, 8],
'C': [9, 10, 11, 12]}
df = pd.DataFrame(data)
# 删除包含缺失值的行
df_dropna = df.dropna()
print(df_dropna)
```
输出结果为:
```
A B C
0 1.0 5.0 9
```
在上面的示例中,我们创建了一个包含缺失值的DataFrame,并使用dropna函数删除了包含缺失值的行。最终输出的结果中只剩下了第一行,因为它是唯一没有缺失值的行。
阅读全文