python中dropna的用法
时间: 2023-09-15 12:20:55 浏览: 90
在 Python 中,dropna() 是 Pandas 模块中的一个函数,用于删除数据集中包含缺失值的行或列。它的语法如下:
```python
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
```
其中,各参数的含义如下:
- `axis`: 表示删除哪个轴上包含缺失值的行或列,0 表示删除包含缺失值的行,1 表示删除包含缺失值的列,默认为 0。
- `how`: 表示删除的方式,可选值为 'any' 或 'all','any' 表示只要该行或列中存在一个缺失值就删除,'all' 表示该行或列所有值都是缺失值才删除,默认为 'any'。
- `thresh`: 表示该行或列中非缺失值的数量,如果该数量小于 thresh,则删除该行或列。
- `subset`: 表示删除哪些列中包含缺失值的行,可以是一个列名列表。
- `inplace`: 表示是否直接在原数据集上进行修改,默认为 False。
下面是一个简单的例子,演示如何使用 dropna() 函数删除包含缺失值的行:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, None, 4], 'B': [5, None, 7, 8], 'C': [9, 10, 11, 12]})
print('原始数据集:\n', df)
# 删除包含缺失值的行
df_dropna = df.dropna()
print('删除缺失值后的数据集:\n', df_dropna)
```
输出结果如下:
```
原始数据集:
A B C
0 1.0 5.0 9
1 2.0 NaN 10
2 NaN 7.0 11
3 4.0 8.0 12
删除缺失值后的数据集:
A B C
0 1.0 5.0 9
3 4.0 8.0 12
```
阅读全文