# 划分区间 bins = [0,1,2,3,4,5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,1220] data = data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数'] # 统计每个柱子的数据 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() # 按照 bins 的顺序给每个柱子指定标签 labels = counts.index.astype(str) fig, ax = plt.subplots(figsize=(18, 6)) # 绘制柱形图 plt.bar(labels, counts) # 添加数据标签 for i, v in enumerate(counts.values): plt.text(i, v, str(v), ha='center', va='bottom') # 设置图表标题和坐标轴标签 plt.title('Score Distribution') plt.xlabel('Range') plt.ylabel('Count') # 显示图表 plt.show() 用xticks修改成按bins顺序排
时间: 2023-12-14 09:37:23 浏览: 68
关于pandas的离散化,面元划分详解
可以在绘制柱形图时,使用参数tick_label来指定x轴刻度的标签,将标签设置为bins列表即可按照bins的顺序排列。修改后的代码如下:
```python
import matplotlib.pyplot as plt
import pandas as pd
# 划分区间
bins = [0, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 1220]
data = data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数']
# 统计每个柱子的数据
hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True)
counts = hist.value_counts()
# 按照 bins 的顺序给每个柱子指定标签
labels = [str(bins[i]) + '-' + str(bins[i+1]-1) for i in range(len(bins)-1)]
fig, ax = plt.subplots(figsize=(18, 6))
# 绘制柱形图
plt.bar(labels, counts, tick_label=labels)
# 添加数据标签
for i, v in enumerate(counts.values):
plt.text(i, v, str(v), ha='center', va='bottom')
# 设置图表标题和坐标轴标签
plt.title('Score Distribution')
plt.xlabel('Range')
plt.ylabel('Count')
# 显示图表
plt.show()
```
修改后的代码将每个柱子的标签设置为了区间范围,例如"0-1"、"1-2"等,同时在绘制柱形图时使用了参数tick_label来指定x轴刻度的标签,以按照bins的顺序排列。
阅读全文