pandas dropna参数
时间: 2023-07-12 16:39:48 浏览: 81
pandas 中的 dropna() 函数用于删除 DataFrame 中的缺失值。它包含以下参数:
- axis: 沿着哪个轴删除缺失值,默认为 0,即删除行。
- how: 删除缺失值的方式,可以为 any 或 all。any 表示如果某行或某列中存在一个或多个缺失值,则删除该行或该列;all 表示如果某行或某列中所有的值都是缺失值,则删除该行或该列。
- thresh: 删除缺失值的阈值,如果某行或某列中缺失值的数量小于该值,则不删除该行或该列。
- subset: 指定需要考虑的列或行,删除其中的缺失值。
- inplace: 是否在原 DataFrame 中就地修改,而不是创建一个新的 DataFrame。
例如,要删除 DataFrame df 中所有包含缺失值的行,可以使用如下代码:
```python
df.dropna()
```
如果要删除所有包含缺失值的列,可以使用 axis 参数:
```python
df.dropna(axis=1)
```
如果要删除所有值都是缺失值的行或列,可以使用 how 参数:
```python
df.dropna(how='all')
```
如果要删除缺失值数量小于 5 的行,可以使用 thresh 参数:
```python
df.dropna(thresh=5)
```
如果要只考虑某几列,可以使用 subset 参数:
```python
df.dropna(subset=['col1', 'col2'])
```
如果要在原 DataFrame 中就地修改,可以使用 inplace 参数:
```python
df.dropna(inplace=True)
```
阅读全文