首页Apache Hudi

Apache Hudi

时间: 2023-10-12 14:05:19 浏览: 119

Apache Hudi是一个开源Spark库，用于在Hadoop上执行诸如更新、插入和删除等操作。它还允许用户仅摄取更改的数据，提高查询效率，并可以像任何作业一样水平扩展，并将数据集直接存储在HDFS上。 Apache Hudi使用插入（upsert）和增量拉取等原语，将流式处理带到了类批处理的大数据中，从而实现了高效的数据管理和处理。 Apache Hudi经过一年半的发展后，已经以顶级项目的身份毕业于Apache软件基金会，这意味着它已经得到了广泛的认可和支持，成为一个可信赖的工具。123 #### 引用[.reference_title] - *1* *3* [Apache Hudi 是什么？](https://blog.csdn.net/Shockang/article/details/126825709)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Apache 数据湖Hudi详解一](https://blog.csdn.net/weixin_41652703/article/details/116562798)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

阅读全文