DataFrame.dropna():用法
时间: 2023-07-25 22:34:38 浏览: 118
详解pandas删除缺失数据(pd.dropna()方法)
`DataFrame.dropna()` 是 Pandas 中用于删除 DataFrame 中缺失值的方法。该方法的基本语法如下:
```python
df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
```
其中,`df` 是要进行删除操作的 DataFrame 对象,`axis` 参数可以指定删除行或删除列,默认情况下删除行,即 `axis=0`;`how` 参数可以指定删除行或列的条件,有 `any` 和 `all` 两种取值,默认情况下为 `any`,即只要该行或列中有缺失值就删除;`thresh` 参数可以指定每行或每列至少需要有多少非缺失值才不会被删除;`subset` 参数可以指定只在某些列中查找缺失值,而不是整个 DataFrame。
例如,如果我们有一个名为 `df` 的 DataFrame,其中有缺失值,我们可以使用以下指令删除缺失值:
```python
df.dropna(inplace=True)
```
这样就会在原 DataFrame 上进行修改,删除所有包含缺失值的行。如果需要删除包含缺失值的列,可以指定 `axis=1`。如果要在某些列中查找缺失值,可以指定 `subset` 参数,例如 `subset=['col1', 'col2']`。如果要保留至少有两个非缺失值的行,可以指定 `thresh=2`。
阅读全文