Azure Storage 中的ORC 是什么格式
时间: 2024-04-27 11:25:10 浏览: 185
ORC(Optimized Row Columnar)是一种用于大规模数据存储和分析的列式存储格式,由Apache Hadoop社区开发并维护。它使用列式存储和压缩来最大限度地减少I/O和存储成本,并提供快速的数据读取和查询性能。ORC格式支持高效的分区、索引和过滤,并可以与多种大数据技术(如Apache Spark、Apache Hive和Presto等)集成使用。在Azure Storage中,ORC格式可以与其他列式存储格式(如Parquet)一起使用,为用户提供更多灵活的选择。
阅读全文