FlinkForwardChina2018重塑流处理存储架构
需积分: 10 109 浏览量
更新于2024-07-17
收藏 30.57MB PDF 举报
FlinkForwardChina2018为流处理世界重新设计的存储
在这个文件中,我们可以看到关于FlinkForwardChina2018的会议内容,它主要关注于流处理和存储的设计。下面我们将对这个文件中的知识点进行总结。
Market Drivers
在流处理世界中,有两个主要的市场驱动力: Unified Batch and Stream Processing(统一批处理和流处理)和Querying the Past and the Future(查询过去和未来)。这两个驱动力来自于实时应用程序的出现和数据增长的需求。
The Quest for Unified Batch and Stream Processing
在流处理世界中,人们需要统一批处理和流处理,以便更好地处理数据。这需要一个统一的存储栈,可以同时处理批处理和流处理。Pravega是一个这样的存储系统,它可以提供高性能、可扩展性和高可用性。
Querying the Past and the Future
在流处理世界中,人们需要查询过去和未来的数据,以便更好地理解数据的变化。Pravega提供了查询过去和未来的功能,可以实时地查询数据。
Today’s “Accidental Architecture”
在流处理世界中,当前的存储架构是“Accidental Architecture”,即随着需求的增加,存储架构也在不断变化。这使得存储架构变得复杂和难以维护。
Building a Unified Batch and Stream Stack
为了解决当前的存储架构问题,人们需要建立一个统一的批处理和流处理栈。Pravega是一个这样的存储系统,可以提供统一的批处理和流处理功能。
The Stack
Pravega的架构栈由多个部分组成,包括Segments、Streams和Beyond the Fundamentals。Segments是Pravega的基本存储单元,Streams是Pravega的流处理单元,Beyond the Fundamentals是Pravega的高级功能。
Pravega Architecture Goals
Pravega的架构目标是提供高性能、可扩展性和高可用性。它需要能够处理大量的数据,提供实时的查询功能,和高效的数据处理能力。
Pravega Fundamentals
Pravega的基本原理是基于Segments和Streams。Segments是Pravega的基本存储单元,Streams是Pravega的流处理单元。
Segments
Segments是Pravega的基本存储单元,每个Segment可以存储大量的数据。Segments可以被分割成多个小块,以便提高数据处理速度。
Streams
Streams是Pravega的流处理单元,每个Stream可以处理大量的流数据。Streams可以实时地处理数据,提供高效的数据处理能力。
Beyond the Fundamentals
Beyond the Fundamentals是Pravega的高级功能,包括Stream Elasticity、Daily Cycles和Pravega Auto Scaling。Stream Elasticity可以动态地调整流处理的速度,Daily Cycles可以自动地处理流数据,Pravega Auto Scaling可以自动地调整存储容量。
Stream Elasticity
Stream Elasticity是Pravega的流处理弹性功能,可以动态地调整流处理的速度,以便更好地处理流数据。
Daily Cycles
Daily Cycles是Pravega的自动处理流数据功能,可以自动地处理流数据,提供高效的数据处理能力。
Pravega Auto Scaling
Pravega Auto Scaling是Pravega的自动调整存储容量功能,可以根据需求自动地调整存储容量,以便提供高效的数据处理能力。
Exactly Once – Ack on write
Exactly Once – Ack on write是Pravega的确保数据一致性的功能,可以确保数据的一致性和可靠性。
Exactly Once – Transactions
Exactly Once – Transactions是Pravega的事务处理功能,可以提供高效的数据处理能力和数据的一致性。
Pravega with Flink
Pravega with Flink是Pravega和Flink的集成,可以提供高效的流处理和批处理功能。
The Complete Pipeline
The Complete Pipeline是Pravega和Flink的完整管道,可以提供高效的流处理和批处理功能。
Outlook: Autoscaling with Flink
Outlook: Autoscaling with Flink是Pravega和Flink的自动调整存储容量功能,可以根据需求自动地调整存储容量,以便提供高效的数据处理能力。
Connecting Flink and Pravega
Connecting Flink and Pravega是Pravega和Flink的集成,可以提供高效的流处理和批处理功能。
FlinkPravegaReader
FlinkPravegaReader是Pravega和Flink的读取器,可以提供高效的流处理和批处理功能。
Details on the Transactional Flink Pravega Writer
Details on the Transactional Flink Pravega Writer是Pravega和Flink的写入器,可以提供高效的流处理和批处理功能。
Transactional Writes
Transactional Writes是Pravega和Flink的事务写入功能,可以提供高效的数据处理能力和数据的一致性。
The FlinkPravegaWriter
The FlinkPravegaWriter是Pravega和Flink的写入器,可以提供高效的流处理和批处理功能。
Exactly-Once Writes
Exactly-Once Writes是Pravega和Flink的确保数据一致性的功能,可以确保数据的一致性和可靠性。
Fails after local snapshot
Fails after local snapshot是Pravega和Flink的故障恢复功能,可以在故障后恢复数据。
Transaction fails before commit…
Transaction fails before commit…是Pravega和Flink的事务失败功能,可以在事务失败后恢复数据。
… commit on recovery
… commit on recovery是Pravega和Flink的恢复提交功能,可以在恢复后提交数据。
A Unified Data Pipeline
A Unified Data Pipeline是Pravega和Flink的统一数据管道,可以提供高效的流处理和批处理功能。
2019-08-29 上传
2019-08-29 上传
2019-08-29 上传
2019-08-29 上传
2019-08-29 上传
2019-08-29 上传
2019-08-29 上传
2021-10-05 上传
2024-12-01 上传
weixin_38743737
- 粉丝: 376
- 资源: 2万+
最新资源
- Angular实现MarcHayek简历展示应用教程
- Crossbow Spot最新更新 - 获取Chrome扩展新闻
- 量子管道网络优化与Python实现
- Debian系统中APT缓存维护工具的使用方法与实践
- Python模块AccessControl的Windows64位安装文件介绍
- 掌握最新*** Fisher资讯,使用Google Chrome扩展
- Ember应用程序开发流程与环境配置指南
- EZPCOpenSDK_v5.1.2_build***版本更新详情
- Postcode-Finder:利用JavaScript和Google Geocode API实现
- AWS商业交易监控器:航线行为分析与营销策略制定
- AccessControl-4.0b6压缩包详细使用教程
- Python编程实践与技巧汇总
- 使用Sikuli和Python打造颜色求解器项目
- .Net基础视频教程:掌握GDI绘图技术
- 深入理解数据结构与JavaScript实践项目
- 双子座在线裁判系统:提高编程竞赛效率