表名:tx_friends 字段:num_cnt 好友数量;day 日期;rtime 时间戳;country 国家;os 手机系统;uid 用户id 1. 按上面的上报定义,编写hive sql 做一个好友中位数及平均数的报表。 一个用户 一天切N次好友列表时 会上报 n个同样的日期,n个不同的时间戳,n个同样的id
时间: 2024-02-23 08:00:15 浏览: 116
PLC.rar_PLC_PLC 课件_plc梯形图_site:www.pudn.com
好的,以下是查询语句:
```
SELECT
day,
country,
os,
PERCENTILE(num_cnt, 0.5) as median_friends,
AVG(num_cnt) as avg_friends
FROM
tx_friends
GROUP BY
day,
country,
os;
```
这个查询语句会按照日期、国家和手机系统分组,然后计算每组的好友数量的中位数和平均数。注意到同一个用户一天内可能会上报多次,但是我们只需要统计一次,因此在这个查询中,我们没有使用uid字段。
阅读全文