首页python将所有指标根据省份和年龄段的多重条件筛选拆分为若干个数据集，并计算拆分后的若干个数据集中的所有指标数据均值的代码

python将所有指标根据省份和年龄段的多重条件筛选拆分为若干个数据集，并计算拆分后的若干个数据集中的所有指标数据均值的代码

时间: 2023-12-10 21:38:13 浏览: 60

假设数据集的名称为`data`，包含以下字段：`province`（省份）、`age_group`（年龄段）、`indicator_1`（指标1）、`indicator_2`（指标2）等。可以使用 Pandas 库进行数据的拆分和计算。代码如下： ```python import pandas as pd # 按省份和年龄段拆分为多个数据集 dfs = [] for province in data['province'].unique(): for age_group in data['age_group'].unique(): df = data[(data['province'] == province) & (data['age_group'] == age_group)] dfs.append(df) # 计算每个数据集中的所有指标均值 means = [] for df in dfs: mean = df.mean() means.append(mean) # 将均值合并为一个数据集 result = pd.concat(means, axis=1).T ``` 拆分后的数据集保存在`dfs`列表中，每个数据集都是一个 Pandas DataFrame 对象。然后，遍历`dfs`列表，计算每个数据集中的所有指标均值，并将均值存储在`means`列表中。最后，使用`pd.concat()`函数将所有均值合并为一个数据集，并将其转置以便于查看。结果保存在`result`变量中。

阅读全文