hive group by 占比
时间: 2023-08-22 19:06:57 浏览: 134
引用中的方式一是通过在子查询中计算各cookieid的pv总和,并使用窗口函数计算出总的pv和每个cookieid的pv占比。然后在外部查询中对cookieid进行分组,计算每个cookieid的pv总和,并将pv占比格式化为百分比形式。最后将结果按照cookieid进行分组。
引用中的方式二是先在子查询中计算每个cookieid的pv总和,并使用窗口函数计算出总的pv总和。然后在外部查询中将结果按照cookieid进行分组,并计算每个cookieid的pv总和。最后将结果按照cookieid进行分组。
引用中的方式三是先在子查询中计算每个countday中各bindtype的counttype总和,并使用窗口函数计算出总的counttype总和。然后在外部查询中将结果按照countday进行分组,并计算每个countday中各bindtype的counttype总和。最后将结果按照countday进行排序。
综上所述,这些方式都是在Hive中使用group by进行分组,并使用窗口函数进行聚合计算。它们可以用于计算各分组的占比。<em>1</em><em>2</em><em>3</em>
#### 引用[.reference_title]
- *1* *2* [业务分析:hive下的分组求占比情况](https://blog.csdn.net/OYY_90/article/details/89843016)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}} ] [.reference_item]
- *3* [大数据 hive 记录 窗口函数 求占比](https://blog.csdn.net/shrek11/article/details/107469307)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}} ] [.reference_item]
[ .reference_list ]
阅读全文