首页pandas 根据字段填充

pandas 根据字段填充

时间: 2023-07-09 10:48:07 浏览: 98

如果你想要根据某个字段的值来填充另一个字段的缺失值，可以使用 `pandas` 库中的 `fillna` 方法。具体操作步骤如下： 1. 使用 `groupby` 方法将数据按照需要填充的字段进行分组。 2. 使用 `transform` 方法将需要填充的字段中的缺失值用该组中的非缺失值的均值、中位数、众数或其他方法进行填充。下面是一个以 `age` 字段为例进行填充的示例代码： ```python import pandas as pd # 构造示例数据 data = pd.DataFrame({ 'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'], 'age': [25, 30, None, 35, None], 'gender': ['Female', 'Male', 'Male', 'Male', 'Female'] }) # 按照 gender 字段分组，使用均值填充 age 字段的缺失值 data['age'] = data.groupby('gender')['age'].transform(lambda x: x.fillna(x.mean())) print(data) ``` 输出结果如下： ``` name age gender 0 Alice 25.0 Female 1 Bob 30.0 Male 2 Charlie 32.5 Male 3 David 35.0 Male 4 Eva 25.0 Female ``` 可以看到，第三行的缺失值被填充为该组中的均值。

阅读全文