查看hive全量表数据量
时间: 2023-08-19 20:13:44 浏览: 60
根据引用\[1\]和引用\[2\]的内容,可以使用以下方法查看Hive全量表数据量。首先,根据系统A的分组标准,记录下每个分组发生变化的数据。然后,系统B将这些发生变化的分组数据删除,并进行全量同步。最后,使用以下命令查看Hive全量表数据量:
```
hadoop fs -du /user/hive/warehouse/table_name/ | awk '{ sum=$1 ;dir2=$2 ; hum\[1024**3\]="Gb";hum\[1024**2\]="Mb";hum\[1024\]="Kb"; for (x=1024**3; x>=1024; x/=1024){ if (sum>=x) { printf "%.2f %s \t %s\n",sum/x,hum\[x\],dir2;break } }}'
```
这个命令会计算并显示指定Hive表的数据量,以GB、MB或KB为单位。
#### 引用[.reference_title]
- *1* *2* [hive全量与增量~的思考](https://blog.csdn.net/yue_2018/article/details/90340635)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item]
- *3* [hive 查询表数据量大小](https://blog.csdn.net/weixin_42411097/article/details/113385945)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]