pandas 根据字段填充
时间: 2023-07-09 10:48:07 浏览: 98
如果你想要根据某个字段的值来填充另一个字段的缺失值,可以使用 `pandas` 库中的 `fillna` 方法。具体操作步骤如下:
1. 使用 `groupby` 方法将数据按照需要填充的字段进行分组。
2. 使用 `transform` 方法将需要填充的字段中的缺失值用该组中的非缺失值的均值、中位数、众数或其他方法进行填充。
下面是一个以 `age` 字段为例进行填充的示例代码:
```python
import pandas as pd
# 构造示例数据
data = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
'age': [25, 30, None, 35, None],
'gender': ['Female', 'Male', 'Male', 'Male', 'Female']
})
# 按照 gender 字段分组,使用均值填充 age 字段的缺失值
data['age'] = data.groupby('gender')['age'].transform(lambda x: x.fillna(x.mean()))
print(data)
```
输出结果如下:
```
name age gender
0 Alice 25.0 Female
1 Bob 30.0 Male
2 Charlie 32.5 Male
3 David 35.0 Male
4 Eva 25.0 Female
```
可以看到,第三行的缺失值被填充为该组中的均值。
阅读全文