excel有单位、职业等级、文化水平、年龄、职务,请用pandas分析excel中数据,并给出各年龄段单位、文化水平、职务分布的代码
时间: 2023-10-20 11:18:54 浏览: 84
假设excel文件名为data.xlsx,数据表名为sheet1,其中包含以下列:单位、职业等级、文化水平、年龄、职务。代码如下:
```python
import pandas as pd
# 读取excel数据
df = pd.read_excel('data.xlsx', sheet_name='sheet1')
# 统计各年龄段单位分布
age_unit_df = df.groupby(['年龄', '单位'])['职务'].count().reset_index()
# 统计各年龄段文化水平分布
age_edu_df = df.groupby(['年龄', '文化水平'])['职务'].count().reset_index()
# 统计各年龄段职务分布
age_job_df = df.groupby(['年龄', '职务'])['文化水平'].count().reset_index()
```
以上代码中,通过`groupby`方法对年龄、单位、文化水平、职务进行分组,然后使用`count`方法统计每个组内的数据个数,并使用`reset_index`方法将多层索引转换为普通列。最后得到三个新的DataFrame对象:`age_unit_df`、`age_edu_df`和`age_job_df`,分别表示各年龄段单位、文化水平、职务的分布情况。可以通过`print`方法查看结果。
阅读全文