利用pandas读取base.xlsx,绘制频数分布直方图,横坐标为年份,纵坐标为总人数
时间: 2024-10-11 22:07:01 浏览: 56
可以使用Python的Pandas库来实现这个需求。首先,你需要确保已经安装了pandas和matplotlib这两个数据处理和绘图库。如果你还没有安装,可以使用pip install pandas matplotlib命令进行安装。
以下是步骤:
1. 导入所需的库:
```python
import pandas as pd
import matplotlib.pyplot as plt
```
2. 使用pandas的read_excel函数读取Excel文件:
```python
df = pd.read_excel('base.xlsx')
```
这里假设Excel文件名为`base.xlsx`,并且它包含年份和总人数的数据。数据需要有明确的列名对应这两个变量。
3. 确定年份列和总人数列的名称,假设分别为`Year`和`Total_Staff`:
```python
year_column = 'Year'
staff_column = 'Total_Staff'
```
4. 创建频率分布直方图:
```python
# 对指定列做分组计频
freq_dist = df[staff_column].value_counts()
# 绘制直方图
plt.figure(figsize=(10,6)) # 设置图表大小
plt.hist(freq_dist.index, freq_dist.values, bins=range(min(df[year_column]), max(df[year_column]) + 2), align='left', edgecolor='black') # 横坐标为年份范围
plt.xlabel(year_column) # 设置x轴标签
plt.ylabel('总人数') # 设置y轴标签
plt.title('按年份统计的总人数分布') # 添加标题
plt.grid(True) # 显示网格线
plt.show()
```
这将创建一个按照年份分布的总人数直方图。
阅读全文