python将所有指标根据省份和年龄段的多重条件筛选拆分为若干个数据集,并计算拆分后的若干个数据集中的所有指标数据均值的代码
时间: 2023-12-10 21:38:13 浏览: 60
假设数据集的名称为`data`,包含以下字段:`province`(省份)、`age_group`(年龄段)、`indicator_1`(指标1)、`indicator_2`(指标2)等。
可以使用 Pandas 库进行数据的拆分和计算。代码如下:
```python
import pandas as pd
# 按省份和年龄段拆分为多个数据集
dfs = []
for province in data['province'].unique():
for age_group in data['age_group'].unique():
df = data[(data['province'] == province) & (data['age_group'] == age_group)]
dfs.append(df)
# 计算每个数据集中的所有指标均值
means = []
for df in dfs:
mean = df.mean()
means.append(mean)
# 将均值合并为一个数据集
result = pd.concat(means, axis=1).T
```
拆分后的数据集保存在`dfs`列表中,每个数据集都是一个 Pandas DataFrame 对象。然后,遍历`dfs`列表,计算每个数据集中的所有指标均值,并将均值存储在`means`列表中。最后,使用`pd.concat()`函数将所有均值合并为一个数据集,并将其转置以便于查看。结果保存在`result`变量中。
阅读全文