hive 分位数percentile
时间: 2023-09-13 18:09:14 浏览: 144
HIVE-分桶表的详解和创建实例.docx
5星 · 资源好评率100%
Hive中计算分位数的函数主要有percentile()和percentile_approx()。percentile()函数用于计算指定列的分位数,其中col是要计算的列(值必须为int类型),p的取值为0-1,例如p=0.2表示计算的是2分位数,依次类推。
而percentile_approx()函数也用于计算分位数,不同之处在于该函数可以计算任何数值类型的列。percentile_approx()函数还有一种形式percentile_approx(col, p,B),其中参数B控制内存消耗的近似精度,B越大,结果的精度越高。默认值为10000。当col字段中的distinct值的个数小于B时,结果就为准确的百分位数。
综上所述,Hive中可以通过percentile()和percentile_approx()函数来计算分位数。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [HiveSQL分位数函数percentile()使用详解+实例代码](https://blog.csdn.net/master_hunter/article/details/126642158)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
- *2* [python多维数组分位数的求取方式](https://download.csdn.net/download/weixin_38716081/13737834)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
- *3* [HIVE SQL分位数percentile使用方法案例](https://blog.csdn.net/qq_44426756/article/details/120218501)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatgptT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"]
[ .reference_list ]
阅读全文