pandas groupby参数
时间: 2023-12-10 14:02:19 浏览: 109
3.Pandas应用 GroupBy
pandas中的groupby()函数是一种非常有用的数据分析工具,它可以根据指定的分组字段对数据进行分组,并对每个分组进行聚合操作。groupby()函数的常用参数如下:
1. by:用于指定分组字段,可以是单个字段或多个字段组成的列表或元组。
2. axis:用于指定分组方向,0表示按行分组,1表示按列分组,默认为0。
3. as_index:用于指定是否以分组字段作为索引,默认为True。
4. sort:用于指定是否对分组结果进行排序,默认为True。
5. group_keys:用于指定是否在结果中包含分组键,默认为True。
以下是两个示例:
1.以单列作为分组字段,不设置索引
```python
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'str': ['A', 'B', 'C', 'A', 'B', 'C'], 'no': [1, 2, 3, 4, 5, 6], 'value': [10, 20, 30, 40, 50, 60]})
# 按照'str'列进行分组
grouped = df.groupby('str')
# 对分组后的结果进行求和操作
result = grouped.sum()
# 输出结果
print(result)
```
输出结果为:
```
no value
str
A 5 50
B 7 70
C 9 90
```
2.以多列作为分组字段,设置索引
```python
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'str': ['A', 'B', 'C', 'A', 'B', 'C'], 'no': [1, 2, 3, 4, 5, 6], 'value': [10, 20, 30, 40, 50, 60]})
# 按照'str'和'no'列进行分组,并将分组结果设置为索引
grouped = df.groupby(["str", "no"], as_index=False)
# 对分组后的结果进行求和操作
result = grouped.sum()
# 输出结果
print(result)
```
输出结果为:
```
str no value
0 A 1 10
1 A 4 40
2 B 2 20
3 B 5 50
4 C 3 30
5 C 6 60
```
阅读全文