京东PrestoDB应用实践:性能优化与业务场景
5星 · 超过95%的资源 需积分: 32 118 浏览量
更新于2024-07-21
收藏 1.84MB PDF 举报
"OSTC2015-京东吕信-prestoDB在京东的应用实践 - V3.0"
本文主要介绍了PrestoDB在京东的应用实践,由京东商城集团运维部数据库工程师吕信进行分享。PrestoDB是一个分布式SQL查询引擎,设计用于交互式数据分析,能够处理从GB到PB级别的大数据。它起源于Facebook,旨在解决Hive查询的高延迟问题,并于2013年开源。PrestoDB因其强大的特性和灵活性,在京东集团得到了广泛的应用和优化。
PrestoDB的主要特性包括:
1. 分布式SQL查询引擎:支持快速、低延迟的查询处理。
2. 交互式数据分析:适合实时或近实时的数据查询需求。
3. 处理大量数据:可以处理从GB到PB级别的大规模数据集。
4. 基于管道的数据处理:高效的并行数据处理机制。
5. ANSI SQL语法:提供标准的SQL接口,易于理解和使用。
6. 跨多数据源查询:能够查询来自不同数据源(如HDFS、Cassandra、MySQL等)的数据。
PrestoDB的整体架构包括MySQL、PostgreSQL、HDFS、Cassandra、Kafka等多个数据源,通过协调器(Coordinator)和工作节点(Worker)协同工作。协调器负责构建查询计划,将任务分配给本地数据的工作节点,工作节点直接从存储插件读取数据并在内存中执行任务,最后结果返回给客户端。
在京东,PrestoDB进行了深度的定制和优化,包括对查询性能的提升,以及适应京东特有的业务场景。例如,通过与Hive的性能测试对比,PrestoDB在多种查询类型(如COUNT(*)、LIMIT、WHERE、GROUP BY、ORDER BY、SUBQUERY和JOIN)上表现出了更好的效率。
京东Presto的研发工作持续进行,以满足日益增长的业务需求。在京东的使用场景中,PrestoDB可能应用于实时数据分析、报表生成、业务监控等方面,帮助京东快速响应市场变化,提升运营效率。
PrestoDB在京东的应用实践展示了其在大数据查询领域的强大能力,通过优化和定制,成功地解决了京东在海量数据处理上的挑战,提升了数据查询的效率和用户体验。
2019-10-18 上传
2015-09-22 上传
2015-09-22 上传
2015-09-22 上传
2015-09-22 上传
2015-09-22 上传
星老果
- 粉丝: 283
- 资源: 55
最新资源
- capstone:投资组合风险分析脚本和仪表板
- ZDOG
- 精品--A resume template written in Markdown,Yaml JSON auto g.zip
- 100-Days-of-UIKit
- idlememstat:空闲内存大小监视器
- java版商城源码-Machi_Koro_Project:在Scrum工作过程中开发的项目
- 单片机msp430g2553中文教程.zip
- 精品--这是我初次使用LaTeX的一个简历模板,共享在此备用.zip
- MM32F0010 库函数和例程.rar
- SFF2FASTA:将SFF转换为FASTA的Python脚本
- rir360-c-header:用于C编程语言的rir360头文件
- EMSystem:ICS 4U0课程的员工管理系统
- c04-ch5-exercices-Jonathan-tsf:c04-ch5-exercices-Jonathan-tsf,由GitHub Classroom创建
- java版商城源码-senior-capstone:高级顶点
- 行业分类-设备装置-合成皮革用高光离型纸.zip
- 最佳农场