pyspark groupBy使用例子
时间: 2023-04-06 12:04:33 浏览: 167
Python中的groupby分组功能的实例代码
可以回答这个问题。下面是一个 pyspark groupBy 的使用例子:
假设有一个包含以下字段的数据集:
```
id, name, age, gender, salary
```
我们想要按照 gender 字段进行分组,并计算每个分组的平均薪资。可以使用以下代码实现:
```python
from pyspark.sql.functions import avg
df.groupBy("gender").agg(avg("salary")).show()
```
这将输出每个 gender 分组的平均薪资。
阅读全文