Apache Hudi
时间: 2023-10-12 14:05:19 浏览: 116
Apache Hive
Apache Hudi是一个开源Spark库,用于在Hadoop上执行诸如更新、插入和删除等操作。它还允许用户仅摄取更改的数据,提高查询效率,并可以像任何作业一样水平扩展,并将数据集直接存储在HDFS上。
Apache Hudi使用插入(upsert)和增量拉取等原语,将流式处理带到了类批处理的大数据中,从而实现了高效的数据管理和处理。
Apache Hudi经过一年半的发展后,已经以顶级项目的身份毕业于Apache软件基金会,这意味着它已经得到了广泛的认可和支持,成为一个可信赖的工具。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [Apache Hudi 是什么?](https://blog.csdn.net/Shockang/article/details/126825709)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* [Apache 数据湖Hudi详解一](https://blog.csdn.net/weixin_41652703/article/details/116562798)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文