没有合适的资源?快使用搜索试试~ 我知道了~
首页这可能是学习 Spark Delta Lake 最全的资料
Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间的乐观并发控制(optimistic concurrency control),在写入数据期间提供一致性的读取,从而为构建在 HDFS 和云存储上的数据湖(data lakes)带来可靠性。Delta Lake 还提供内置数据版本控制,以便轻松回滚。 为了更好的学习 Delta Lake ,本文收集了互联网上各种关于 Apache Spark Delta Lake 的资料,供大家学习交流,包括 PPT、视频、源码解析、技术文章等;另外,本文也会持续不断
资源详情
资源评论
资源推荐

这可能是学习这可能是学习 Spark Delta Lake 最全的资料最全的资料
Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间的乐观并发
控制(optimistic concurrency control),在写入数据期间提供一致性的读取,从而为构建在 HDFS 和云存储上的数据湖
(data lakes)带来可靠性。Delta Lake 还提供内置数据版本控制,以便轻松回滚。
为了更好的学习 Delta Lake ,本文收集了互联网上各种关于 Apache Spark Delta Lake 的资料,供大家学习交流,包括
PPT、视频、源码解析、技术文章等;另外,本文也会持续不断更新。
如果想及时了解
Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:iteblog_hadoop
PPT & 视频视频
目前关于 Delta Lake 的视频和 PPT 基本上都来自 Databricks 的大神们在各种场合分享的,本文对这些分享的资料进行了收
集,具体如下:
Delta Lake – Open Source Reliability for Data Lakes
本分享来自 Michael Armbrust,负责 Delta Lake 的首席工程师,也是 Spark SQL 和 Structured Streaming 的核心开发者。这
篇 PPT 介绍的比较详细,涉及到 Delta Lake 项目诞生背景、核心功能以及实现原理等。
配套视频配套视频 & PPT 下载下载:关注 开发爱好者社区(开发爱好者社区(bigdata_ai)) 微信公众号,并回复 2596_1 获取。
Making Apache Spark™ Better with Delta Lake
也是 Michael Armbrust 分享的。主题主要包括以下内容:
Apache Spark 在大数据处理中的作用;
使用数据湖作为数据架构的重要组成部分;


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0