python pandas 中的分组聚合求占比

可以使用 `groupby()` 和 `agg()` 方法来实现分组聚合求占比的操作。下面是一个例子：假设有一个数据集 `df` 包含两列数据 `A` 和 `B`，我们想要按照 `A` 列进行分组，然后计算每个组中 `B` 列的值的占比。 ```python import pandas as pd # 创建一个示例数据集 df = pd.DataFrame({ 'A': ['a', 'a', 'b', 'b', 'b'], 'B': [1, 2, 3, 4, 5] }) # 按照 A 列进行分组，然后计算每个组中 B 列的值的占比 result = df.groupby('A').agg({'B': 'sum'}).apply(lambda x: x / float(x.sum())) print(result) ``` 输出结果如下： ``` B A a 0.166667 b 0.833333 ``` 其中，`agg()` 方法接收一个字典类型的参数，键为需要聚合的列名，值为需要进行的聚合操作。在本例中，我们只需要对 `B` 列进行求和操作，所以字典中只有一个键值对。然后，我们使用 `apply()` 方法将每个组中的值除以总和，得到每个组中的值的占比。最后，我们得到了按照 `A` 列分组后每个组中 `B` 列值的占比。

使用python中的pandas模块和matplotlib模块可以实现物资信息的读取和可视化，应用ABC分类法，生成物资占比及累计占比图。

Python中的Pandas库是一个强大的数据处理工具，常用于数据清洗、整理和分析。Matplotlib则是数据可视化的主要库，能够创建各种图表，包括线图、柱状图等。结合这两者，你可以按照以下步骤操作： 1. 首先，使用Pandas读取物资信息的数据文件，例如CSV、Excel或数据库表。`pandas.read_csv()`函数可以轻松地从CSV文件加载数据。 ```python import pandas as pd data = pd.read_csv('物资信息.csv') ``` 2. 然后对数据进行预处理，将物资按ABC分类法分组。这通常基于物资的重要性或其他度量标准计算出每个类别。 ```python data['分类'] = data['重要性'].apply(lambda x: 'A' if x > 80 else ('B' if 50 <= x < 80 else 'C')) ``` 3. 接着，利用Pandas的聚合功能统计每类物资的数量占比和累计占比。 ```python category_counts = data.groupby('分类')['物资编号'].count() cumulative_counts = category_counts.cumsum() / category_counts.sum() ``` 4. 最后，使用Matplotlib绘制物资占比和累计占比的条形图或者饼图。这里以条形图为例： ```python import matplotlib.pyplot as plt plt.bar(category_counts.index, category_counts.values) plt.xlabel('物资分类') plt.ylabel('数量') plt.title('物资类别占比') plt.show() plt.plot(cumulative_counts, label='累计占比', marker='o') plt.legend() plt.title('物资累计占比') plt.show() ```

阅读全文

python pandas 中的分组聚合求占比

使用python中的pandas模块和matplotlib模块可以实现物资信息的读取和可视化，应用ABC分类法，生成物资占比及累计占比图。

相关推荐

Python数据分析在环保领域中的应用：汇总与趋势研究

Python数据分析全套教程，从基础到预测

Python实现堆叠柱形图以分析用户体验效果

统计学-使用python自动分箱和计算累积占比

Python中的groupby分组功能的实例代码

Pandas实现DataFrame按行求百分数(比例数)

pandas实现excel中的数据透视表和Vlookup函数功能代码

python疫情数据可视化_Python疫情_python_疫情数据_数据可视化_疫情_

Pandas时间序列与数据可视化详解

Pandas中的逻辑回归分析

使用Python进行数据探索与分析：Pandas数据处理技巧

pandas中的数据可视化技术应用

【Python数据分析与可视化】：Pandas、NumPy与Matplotlib的实战应用

Django聚合案例分析：电商数据分析中的聚合应用实战

Pandas数据框架在科学计算中的高级操作

Python中数据可视化的最佳实践

【数据分析进阶】：Pandas与NumPy在Anaconda中的高级应用法

【科学计算集成环境】：NumPy、Pandas与Matplotlib在Jupyter中的协同

Pandas 与 Matplotlib实战系列-导读

大家在看

关于Tessy的使用方法总结

silvaco中文学习资料

PTC Creo® 3.0 安装与管理指南

电力系统微网故障检测数据集及代码python

山东大学2021~2022江湖救急笔记——计算机系统原理

最新推荐

pandas实现excel中的数据透视表和Vlookup函数功能代码

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

（参考GUI）MATLAB GUI漂浮物垃圾分类检测.zip

人脸识别_OpenCV_活体检测_证件照拍照_Demo_1741778955.zip

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集