hive 分位数percentile 窗口函数
时间: 2023-09-25 08:17:33 浏览: 224
Hive中可以使用percentile()和percentile_approx()这两个函数来计算分位数。percentile()函数用于计算分位数,但在处理大数据量时,速度较慢,可能无法计算出结果。为了解决这个问题,可以使用row_number()函数和子查询来实现类似的功能。通过给数据排序,并筛选出特定百分比的行数,可以得到分位数的近似值。而percentile_approx()函数则相对灵活一些,可以处理数值和整型的字段,并且可以通过调整参数B来控制内存消耗和精度。具体使用方式为percentile(col, p)和percentile_approx(col, p, B),其中col是要计算的列名,p是需要计算的分位数百分比,B用于控制内存消耗和精度。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [HiveSQL分位数函数percentile()使用详解+实例代码](https://blog.csdn.net/master_hunter/article/details/126642158)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
- *2* [python多维数组分位数的求取方式](https://download.csdn.net/download/weixin_38716081/13737834)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
- *3* [hive窗口函数+分位数](https://blog.csdn.net/changzoe/article/details/101015922)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
[ .reference_list ]
阅读全文