Python读取‘新生数据.xls’,绘制各省男女人数堆叠柱形图(横坐标为各省,纵坐标为人数,创建带有2行2列子图的窗口以显示上述4图
时间: 2023-05-26 19:05:25 浏览: 172
以下是可以实现上述需求的Python代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
df = pd.read_excel('新生数据.xls')
# 按照省份分组,并计算男女人数之和
df_grouped = df.groupby('省份').sum()
# 创建带有2行2列子图的窗口
fig, axs = plt.subplots(2, 2, figsize=(20, 12))
# 绘制第一个子图:男女人数堆叠柱形图
df_grouped[['男', '女']].plot(kind='bar', stacked=True, ax=axs[0, 0])
axs[0, 0].set_title('各省男女人数')
# 绘制第二个子图:男女比例堆叠柱形图
(df_grouped['男'] / df_grouped['女']).plot(kind='bar', ax=axs[0, 1])
axs[0, 1].set_title('各省男女比例')
# 绘制第三个子图:男女人数折线图
df_grouped[['男', '女']].plot(kind='line', ax=axs[1, 0])
axs[1, 0].set_title('各省男女人数走势')
# 绘制第四个子图:男女比例折线图
(df_grouped['男'] / df_grouped['女']).plot(kind='line', ax=axs[1, 1])
axs[1, 1].set_title('各省男女比例走势')
# 显示图形
plt.show()
```
代码解析:
1. 使用pandas库的`read_excel()`函数读取Excel文件‘新生数据.xls’。
2. 按照省份分组,使用`groupby()`函数并传入‘省份’作为参数。然后使用`sum()`函数计算每个省份的男女人数之和。
3. 使用`subplots()`函数创建带有2行2列子图的窗口,并将返回的两个对象分别赋给`fig`和`axs`变量。其中`fig`代表整个窗口对象,`axs`代表子图对象列表。
4. 绘制四个子图:
- 第一个子图是各省男女人数的堆叠柱形图。使用`plot(kind='bar', stacked=True)`函数绘制。
- 第二个子图是各省男女比例的堆叠柱形图。由于男女比例是一个小数值,不适合使用堆叠柱形图展示,因此单独绘制。使用`plot(kind='bar')`函数绘制。
- 第三个子图是各省男女人数的折线图。使用`plot(kind='line')`函数绘制。
- 第四个子图是各省男女比例的折线图。使用`plot(kind='line')`函数绘制。
5. 使用`set_title()`函数设置每个子图的标题。
6. 使用`show()`函数显示图形。
阅读全文