python中dropna的subset函数
时间: 2023-11-17 22:07:51 浏览: 48
在Python中,dropna函数是pandas库中的一个函数,用于删除包含缺失值的行或列。该函数可以应用于DataFrame和Series对象。
subset参数用于指定要应用dropna函数的列或行。它可以是一个字符串、一个列表或一个元组,用来指定要删除缺失值的列或行。默认情况下,subset参数为None,表示对整个DataFrame或Series应用dropna函数。
下面是一些示例用法:
1. 在DataFrame中删除包含缺失值的行:
```python
import pandas as pd
data = {'A': [1, 2, None, 4, None],
'B': [None, 6, 7, None, 9],
'C': [10, 11, 12, 13, 14]}
df = pd.DataFrame(data)
df.dropna(subset=['A']) # 删除包含缺失值的行,只针对'A'列
```
2. 在DataFrame中删除包含缺失值的列:
```python
df.dropna(subset=['A', 'B']) # 删除包含缺失值的列,针对'A'和'B'列
```
3. 在Series中删除包含缺失值的元素:
```python
s = pd.Series([1, None, 3, None, 5])
s.dropna(subset=[0, 1]) # 删除包含缺失值的元素,只针对索引为0和1的元素
```