dataframe中groupby的用法
时间: 2023-09-14 08:11:45 浏览: 90
Pandas中的groupby()函数是一种非常有用的操作,它可以按照一个或多个列对数据进行分组并进行聚合操作。以下是groupby的一些用法:
1. 按照一个列进行分组:
```python
df.groupby('column_name')
```
2. 按照多个列进行分组:
```python
df.groupby(['column_name1', 'column_name2'])
```
3. 对分组后的数据进行一些聚合操作,比如求和、平均值等:
```python
df.groupby('column_name').sum()
df.groupby('column_name').mean()
```
4. 对每个分组进行一些自定义的聚合操作:
```python
df.groupby('column_name').agg({'column1': 'sum', 'column2': 'mean'})
```
5. 对每个分组进行一些过滤操作:
```python
df.groupby('column_name').filter(lambda x: x['column1'].sum() > 100)
```
6. 对每个分组进行一些变换操作:
```python
df.groupby('column_name').transform(lambda x: x - x.mean())
```
7. 对每个分组进行一些排序操作:
```python
df.groupby('column_name').apply(lambda x: x.sort_values('column1'))
```
阅读全文