df.groupBy(df.name).agg({'score':'mean'}).show()添加条件查询平均成绩大于等于60分的姓名和平均成绩
时间: 2023-07-16 07:16:43 浏览: 79
SQL+SERVER精华查询语句.pdf
可以在`agg`函数中使用`filter`来添加条件查询,如下所示:
```
from pyspark.sql.functions import col
df.groupBy('name').agg({'score': 'mean'}).filter(col('avg(score)') >= 60).show()
```
其中,`col('avg(score)')`表示选取“平均成绩”这一列,并对其中的每个值应用`avg`函数求平均值;`filter(col('avg(score)') >= 60)`表示对平均成绩大于等于60分的记录进行过滤。最后,使用`show`函数展示结果。
阅读全文