parquet 表和orc表的区别 如何选用
时间: 2024-06-10 09:03:58 浏览: 218
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(一)
parquet表和orc表都是列式存储的数据格式,但是它们有一些区别。首先,parquet表支持所有的Hadoop生态系统,而orc表只支持Hive。其次,parquet表适合于列扫描,而orc表适合于行扫描。此外,parquet表的读写性能比orc表更快,但是orc表在压缩和存储方面比parquet表更强大。在选择时,应根据实际需求和环境选择合适的表格格式。
阅读全文