Python里dropna函数
时间: 2023-07-09 15:21:02 浏览: 97
在 Pandas 库中,DataFrame 对象提供了 dropna() 方法,用于删除 DataFrame 中的缺失值。该方法可以根据指定的轴、缺失值出现的数量等条件进行删除操作,并返回一个新的 DataFrame,其中已经删除了缺失值。
dropna() 方法的语法如下:
```python
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
```
其中,axis 参数用于指定删除缺失值的轴,0 表示删除行,1 表示删除列;how 参数用于指定删除缺失值的方式,'any' 表示只要出现缺失值就删除,'all' 表示只有当整行或整列都是缺失值时才删除;thresh 参数用于指定保留的非缺失值的最小数量;subset 参数用于指定删除操作依据的列名。inplace 参数用于指定是否在原始 DataFrame 上进行删除操作,默认为 False,即返回一个新的 DataFrame。
示例代码:
```python
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5]})
print(df)
# 删除缺失值
new_df = df.dropna()
print(new_df)
```
以上代码中,我们构造了一个包含缺失值的 DataFrame,并使用 dropna() 方法删除了其中的缺失值。输出结果如下:
```python
A B
0 1.0 3.0
1 2.0 NaN
2 NaN 5.0
A B
0 1.0 3.0
```
以上输出结果表明,经过删除操作后,只剩下了原始 DataFrame 中没有缺失值的那一行。
阅读全文