hive查找200m文件
时间: 2023-08-24 07:14:54 浏览: 106
要在Hive中查找200MB的文件,你可以使用以下步骤:
1. 使用Hadoop命令`hadoop fs -ls`来列出HDFS上的文件和目录。例如,你可以运行以下命令来查找指定目录下的文件:
```
hadoop fs -ls hdfs://nameservice1/user/hive/warehouse/tmp.db/cdl_push_r
```
2. 在列出的结果中,查找文件大小为200MB的文件。你可以通过查看文件的大小列来确定文件的大小。
请注意,文件大小的单位是字节,所以你需要将200MB转换为字节来进行比较。如果你找到了大小为200MB的文件,你可以进一步处理它,例如将其导入到Hive表中进行分析。
#### 引用[.reference_title]
- *1* [hive表小文件合并java程序](https://blog.csdn.net/u012443641/article/details/131474587)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [查找hive表的存储位置并查看表文件大小及分区文件名](https://blog.csdn.net/u010438126/article/details/127404080)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *3* [hive小文件过多问题解决方法](https://blog.csdn.net/ytp552200ytp/article/details/124090920)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文