hudi是不是数据存储框架
时间: 2023-08-29 11:05:13 浏览: 98
数据湖Hudi操作文档和实例代码
5星 · 资源好评率100%
是的,Apache Hudi(Hadoop Upserts Deletes and Incrementals)是一个用于构建和管理大规模数据湖的开源数据存储框架。Hudi提供了一种基于分布式文件系统(如Hadoop HDFS)的数据存储格式和索引结构,以支持大规模数据的插入、更新、删除和增量处理。
Hudi的设计目标是提供高性能、可伸缩和容错的数据湖管理解决方案。它支持以时间为单位的数据版本管理,可以实现时间旅行查询(即查询历史数据版本)。Hudi还提供了基于写前日志(WAL)的机制,确保数据一致性和可恢复性。
除了数据存储功能,Hudi还提供了用于数据处理和查询的A
阅读全文