划分区间 bins = [0,1,2,3,4,5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,1220] data=data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数'] # 统计每个柱子的数据 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() # 按照 bins 的顺序给每个柱子指定标签 labels = [f'{bins[i]}-{bins[i+1]}' for i in range(len(bins)-1)] fig, ax = plt.subplots(figsize=(12, 6)) # 绘制柱形图 plt.bar(counts.index.astype(str), counts.values) # 添加数据标签 for i, v in enumerate(counts.values): plt.text(i, v, str(v), ha='center', va='bottom') # 设置图表标题和坐标轴标签 plt.title('Score Distribution') plt.xlabel('Range') plt.ylabel('Count') # 显示图表 plt.show() 柱形图从左到右是按数量从大到小显示的顺序，能不能按bins中的顺序从左往右显示

时间: 2023-12-14 11:36:36 浏览: 58

可以按照 bins 中的顺序从左往右显示，只需要在绘制柱形图时指定 x 轴的标签为 labels 即可。修改代码如下： ``` fig, ax = plt.subplots(figsize=(12, 6)) # 绘制柱形图，并按照 labels 的顺序指定 x 轴的标签 plt.bar(labels, counts[labels]) # 添加数据标签 for i, v in enumerate(counts[labels]): plt.text(i, v, str(v), ha='center', va='bottom') # 设置图表标题和坐标轴标签 plt.title('Score Distribution') plt.xlabel('Range') plt.ylabel('Count') # 显示图表 plt.show() ```

# 划分区间 bins = [0,1,2,3,4,5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,1220] data = data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数'] data1 = data_forecast_is_stk_bs_rpt_cw_befor_big['本年比上一年归母倍数'] # 统计每个柱子的数据 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) hist1, edges1 = pd.cut(data1, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() counts1 = hist1.value_counts() # 按照 hist 的顺序重新排序 counts counts = counts.reindex(hist.cat.categories) counts1 = counts1.reindex(hist1.cat.categories) # 按照 bins 的顺序给每个柱子指定标签 labels = counts.index.astype(str) labels1 = counts1.index.astype(str) fig, ax = plt.subplots(figsize=(18, 6)) # 绘制柱形图 #plt.bar(labels, counts) plt.bar(labels, counts, width=0.4, align='center', label='Data 1') plt.bar(labels1, counts1, width=0.4, align='center', label='Data 2') 2个柱子合并了能不能分开

可以分开绘制，只需要将绘制柱状图的代码分别写在两个子图中即可。可以参考如下代码： ``` fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 6)) # 绘制第一个子图 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) hist1, edges1 = pd.cut(data1, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() counts1 = hist1.value_counts() counts = counts.reindex(hist.cat.categories) counts1 = counts1.reindex(hist1.cat.categories) labels = counts.index.astype(str) labels1 = counts1.index.astype(str) ax1.bar(labels, counts, width=0.4, align='center', label='Data 1') ax1.set_title('Data 1') # 绘制第二个子图 ax2.bar(labels1, counts1, width=0.4, align='center', label='Data 2') ax2.set_title('Data 2') # 添加图例 fig.legend(loc='upper right') plt.show() ``` 这里使用了 `subplots` 函数创建了两个子图，并将绘制柱状图的代码分别写在了两个子图中。同时，为了方便区分两个子图，我在每个子图的标题中添加了不同的数据标识。最后，通过 `fig.legend` 函数添加了图例。

# 划分区间 bins = [0,1,2,3,4,5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,1220] data=data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数'] # 统计每个柱子的数据 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() # 按照 bins 的顺序给每个柱子指定标签 labels = [f'{bins[i]}-{bins[i+1]}' for i in range(len(bins)-1)] fig, ax = plt.subplots(figsize=(18, 6)) # 绘制柱形图 plt.bar(counts.index.astype(str), counts[labels]) # 添加数据标签 for i, v in enumerate(counts.values): plt.text(i, v, str(v), ha='center', va='bottom') # 设置图表标题和坐标轴标签 plt.title('Score Distribution') plt.xlabel('Range') plt.ylabel('Count') # 显示图表 plt.show() KeyError: "None of [['0-1', '1-2', '2-3', '3-4', '4-5', '5-10', '10-15', '15-20', '20-25', '25-30', '30-35', '35-40', '40-45', '45-50', '50-60', '60-70', '70-80', '80-90', '90-100', '100-1220']] are in the [index]"

这个 KeyError 的原因是因为 hist.value_counts() 方法返回的是一个以区间标签作为索引的 Series，而在 plt.bar(counts.index.astype(str), counts[labels]) 中使用了 counts[labels]，这里的 labels 是一个列表，不是一个合法的索引。可以将 labels 改为 counts.index.astype(str)，即可解决该问题。修改后的代码如下： ``` # 划分区间 bins = [0,1,2,3,4,5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,1220] data = data_forecast_is_stk_bs_rpt_zq_befor_big['本年比上一年归母倍数'] # 统计每个柱子的数据 hist, edges = pd.cut(data, bins=bins, right=False, include_lowest=True, retbins=True) counts = hist.value_counts() # 按照 bins 的顺序给每个柱子指定标签 labels = counts.index.astype(str) fig, ax = plt.subplots(figsize=(18, 6)) # 绘制柱形图 plt.bar(labels, counts) # 添加数据标签 for i, v in enumerate(counts.values): plt.text(i, v, str(v), ha='center', va='bottom') # 设置图表标题和坐标轴标签 plt.title('Score Distribution') plt.xlabel('Range') plt.ylabel('Count') # 显示图表 plt.show() ```

阅读全文

相关推荐

关于pandas的离散化,面元划分详解

image-search-with-content.rar_eluosi1.jpg_search image_人体器官图pd_图

C 代码 演示如何构造概率密度函数 （PDF） 来自 2D 域上的样本数据.rar

plt.hist(data, bins=30)

hist = np.histogram(image, bins=256, range=(0,255))[0]含义

《CSS样式表行为手册》中文chm最新版本

1-中国各地区-固定资产投资-房地产开发投资情况（1999-2020年）-社科数据.zip

1-中国各地区数字经济发展对环境污染的影响数据（2011-2021年）-社科数据.zip

1-中国各区县-工业行业企业数2004-2020年-社科数据.zip

BGM坏了吗111111

毕业设计&课设_主要语言为 Java，含相关文件及配置.zip

Puppet 模块用于安装和管理 Python、pip、virtualenvs 和 Gunicorn 虚拟主机 .zip

WorldPO连接器标准尺寸及其选型指南，包含1.27mm、0.8mm、0.5mm间距的高速连接器

操作系统概述期末复习题（含解析）

毕业设计&课设_博客系统，含前后端技术，附搭建教程，曾获优秀毕业论文及展示页面截图.zip

最新推荐

《CSS样式表行为手册》中文chm最新版本

1-中国各地区-固定资产投资-房地产开发投资情况（1999-2020年）-社科数据.zip

1-中国各地区数字经济发展对环境污染的影响数据（2011-2021年）-社科数据.zip

1-中国各区县-工业行业企业数2004-2020年-社科数据.zip

BGM坏了吗111111

火炬连体网络在MNIST的2D嵌入实现示例

管理建模和仿真的文件

L2正则化的终极指南：从入门到精通，揭秘机器学习中的性能优化技巧

如何构建一个符合GB/T19716和ISO/IEC13335标准的信息安全事件管理框架，并确保业务连续性规划的有效性？

Angular插件增强Application Insights JavaScript SDK功能

C 代码演示如何构造概率密度函数（PDF）来自 2D 域上的样本数据.rar