dataframe按照pclass类型,利用pclass类别均值apply函数填补age缺失值
时间: 2023-07-06 09:27:34 浏览: 132
均值、0、和随机森林来填补缺失值
好的,针对您的问题,可以使用 Pandas 库的 `apply` 函数来完成。以下是示例代码:
```python
import pandas as pd
# 读取数据
df = pd.read_csv('your_data.csv')
# 定义函数,用于填补缺失值
def fill_na(row, pclass_means):
if pd.isnull(row['age']):
return pclass_means[row['pclass']]
else:
return row['age']
# 计算不同 pclass 的 age 均值
pclass_means = df.groupby('pclass')['age'].mean()
# 使用 apply 函数填补缺失值
df['age'] = df.apply(lambda row: fill_na(row, pclass_means), axis=1)
```
其中,`your_data.csv` 是您的数据文件名,需要根据实际情况进行修改。这段代码会计算不同 `pclass` 的 `age` 均值,并使用 `apply` 函数填补缺失值。
阅读全文