hive的orc和parquet
时间: 2023-11-11 16:56:25 浏览: 232
1、通过亿级数据量在hive和impala中查询比较text、orc和parquet性能表现(一)
hive的orc和parquet都是用于在hadoop生态系统中存储和处理大规模数据的列式存储格式。它们都具有压缩、高效读写和查询性能优化等特点。orc文件是针对大规模数据分析设计的一种优化的行列式文件格式,它可以提供更好的压缩率和查询性能。而parquet文件则是为了使hadoop生态系统中的任何项目都可以使用压缩的、高效的列式数据表示形式而设计的,它支持多种压缩格式。
阅读全文