python中dropna函数的用法
时间: 2023-06-21 14:05:57 浏览: 249
`dropna()` 是 pandas 库中的一个函数,用于删除 DataFrame 或 Series 中的缺失值。
**语法:**
```python
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
```
参数说明:
- `axis`:指定删除的行或列,0 表示删除行,1 表示删除列,默认为 0;
- `how`:指定删除的方式,'any' 表示只要有缺失值就删除,'all' 表示全部为缺失值才删除,默认为 'any';
- `thresh`:指定保留的非缺失值数量,如果一行/列中非缺失值数量少于 thresh,则会被删除;
- `subset`:指定对哪些列进行缺失值删除;
- `inplace`:是否对原始 DataFrame 进行修改,默认为 False,即不修改原始 DataFrame。
**示例:**
```python
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 2, np.nan, 4],
'B': [5, np.nan, 7, 8],
'C': [9, 10, 11, 12]})
# 删除包含缺失值的行
df.dropna()
# 删除包含缺失值的列
df.dropna(axis=1)
# 只删除全是缺失值的行
df.dropna(how='all')
# 只保留至少有 2 个非缺失值的行
df.dropna(thresh=2)
# 只对 A 列和 B 列进行缺失值删除
df.dropna(subset=['A', 'B'])
```
阅读全文