Python Pandas：聚合与分组运算详解及示例

dataframe

103 浏览量更新于2024-08-28 收藏 41KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

本篇文章主要介绍了Pandas库在Python中进行聚合运算和分组运算的基本概念和实现方法。Pandas是数据处理的强大工具，对于数据分析和清洗工作中常见的数据汇总、计算平均值、最大值、最小值以及描述性统计等操作提供了便利。 **1. 聚合运算** - **内置聚合函数**： Pandas内置了多种聚合函数，如`sum()`用于求和，`mean()`计算平均值，`max()`获取最大值，`min()`取最小值，`size()`返回行数，`describe()`则提供了各种统计数据的概览。例如，通过以下代码，我们可以根据'key1'列对'data1'和'data2'列进行求和： ```python df.groupby('key1').sum() ``` 输出结果展示了每个'key1'值对应的'data1'和'data2'总和。 - **自定义聚合函数**：对于更复杂的聚合需求，可以利用`agg()`函数结合自定义函数。例如，这里展示了一个自定义函数`peak_range()`，计算每组数据的最大值与最小值之差，即峰度范围： ```python def peak_range(df): return (df.max() - df.min()) df.groupby('key1').agg(peak_range) ``` **2. 分组运算** - **基于列进行分组**：使用`groupby()`函数可以根据一个或多个列对数据进行分组。如上述代码中的`df.groupby('key1')`将数据按照'key1'列进行分组。 - **应用聚合函数到分组**：对于分组后的数据，可以直接调用聚合函数，如`sum()`、`max()`、`min()`、`mean()`等，得到每个组的汇总信息。 - **其他统计量**： `size()`返回每个组的行数，`count()`计算非空值的数量，`describe()`则提供一组统计摘要，包括计数、均值、标准差、最小值、25%分位数、50%分位数（中位数）、75%分位数和最大值。通过这些示例，读者可以理解如何在Pandas中灵活运用聚合和分组功能，对数据进行高效处理和分析。无论是处理大量数据还是执行定制的计算，Pandas都是数据科学和数据分析中不可或缺的工具。

资源详情

资源推荐

Pandas聚合运算和分组运算的实现示例聚合运算和分组运算的实现示例

1.聚合运算聚合运算

(1)使用内置的聚合运算函数进行计算

1>内置的聚合运算函数

sum(),mean(),max(),min(),size(),describe()…等等

2>应用聚合运算函数进行计算

import numpy as np

import pandas as pd

#创建df对象

dict_data = {

'key1':['a','b','c','d','a','b','c','d'],

'key2':['one','two','three','one','two','three','one','two'],

'data1':np.random.randint(1,10,8),

'data2':np.random.randint(1,10,8)

}

df = pd.DataFrame(dict_data)

print(df)

'''

data1 data2 key1 key2

0 3 4 a one

1 7 9 b two

2 5 7 c three

3 3 4 d one

4 8 7 a two

5 4 7 b three

6 8 9 c one

7 4 4 d two

'''

#根据key1分组,进行sum()运算

df = df.groupby('key1').sum()

print(df)

'''

key1

a 12 10

b 8 5

c 8 11

d 16 13

'''

#内置的聚合函数

print(df.groupby('key1').sum())

print('*'*50)

print(df.groupby('key1').max())

print('*'*50)

print(df.groupby('key1').min())

print('*'*50)

print(df.groupby('key1').mean())

print('*'*50)

print(df.groupby('key1').size())

print('*'*50)

#分组中非Nan数据的数量

print(df.groupby('key1').count())

print('*'*50)

print(df.groupby('key1').describe())

(2)自定义聚合函数进行计算

在使用自定义聚合函数的时候,需要用到一个agg()函数

#自定义聚合函数

#最大值-最小值

def peak_range(df):

#返回数据范围差值

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38724247

粉丝: 8
资源: 915

Python Pandas：聚合与分组运算详解及示例

pandas数据分组和聚合操作方法

pandas数据聚合与分组操作全解析

Pandas中的数据分组与聚合

Pandas数据分组分析实战教程：从分组运算到聚合函数，全面掌握分组技巧

Pandas数据分组分析揭秘：掌握分组运算，洞察数据奥秘

如何在DataFrame中进行数据聚合运算

pandas聚合函数

pandas 分组数据 统计

pandas与bottleneck

pandas方法 groupby函数

用jupter爬取朋友圈的信息，并用numpy和pandas进行基本的数据分析

pandas定位空白行位置，返回行数索引

python groupby agg count

dataframe中groupby函数

numpy笔记.xmind

Python第三方库都有什么,分别都是干嘛用的,请举例

python构造辅助列

weixin123在线订餐系统的设计与实现+springboot.rar

weixin262高校校园交友微信小程序springboot.rar

基于java的视频网站系统的设计与实现.docx

最新资源

pandas 分组数据统计