hudi spark
时间: 2023-10-19 10:30:02 浏览: 125
spark i need
Hudi(Hadoop Upserts Deletes and Incrementals)是一个开源的Apache Hadoop数据湖表管理工具,它提供了增量更新、删除和追加等功能。Hudi是为大数据湖架构设计的,可以在Apache Spark上使用。它基于列式存储格式进行存储,提供了高性能的数据写入和查询能力,同时还支持ACID事务。Hudi还提供了一套用于数据管理的API和命令行工具,可以方便地管理数据表,包括创建、删除、合并等操作。
阅读全文