唯品会的Presto与Clickhouse实践:多维分析与实时OLAP
版权申诉
104 浏览量
更新于2024-07-05
收藏 2.27MB PDF 举报
"9-5+Presto和Clickhouse在唯品会的实践.pdf"
在唯品会的IT实践中,OLAP(Online Analytical Processing)系统扮演了关键角色,主要用于支持大规模的数据分析和决策支持。这篇演讲主要围绕Presto和Clickhouse在唯品会的应用和演进进行了深入探讨。
首先,OLAP在唯品会的演进历程展示了数据处理需求的增长和技术创新。Presto作为一种分布式SQL查询引擎,已被广泛应用于唯品会的20多个线上业务,其集群规模达到了500多台物理机,每天处理的查询次数高达500万次,涉及的数据量将近3PB。这体现了唯品会在大数据处理上的高度需求和Presto的高性能处理能力。
Clickhouse是另一个在唯品会得到应用的实时OLAP数据库,它构建了两个集群,共计40台高配置物理机,服务于实验平台、OLAP日志查询和打点监控等多个项目。Clickhouse以其快速的列式存储和在线分析性能,满足了实时数据分析场景的需求。
在Presto的实践方面,演讲提到了Presto的自研管控工具——Spider。这个工具解决了因业务数据量增长带来的挑战,包括多集群路由、集群HA(High Availability)、负载均衡、查询回溯和全链路监控等功能。Spider通过智能路由策略确保查询被发送到最合适的集群,并在遇到故障时实现集群的热切换。此外,Spider还与Redis和MySQL、Hive配合,实现了查询数据的落地和历史查询的检索。对于资源消耗过高的查询,Spider能够自动进行监控和杀掉,防止对集群性能的影响,并对数据倾斜的查询发出警告。
唯品会的OLAP未来展望可能涉及进一步优化Presto和Clickhouse的性能,提升数据处理效率,以及探索新的数据分析技术以适应不断增长的数据量和复杂查询需求。这可能包括扩展集群规模、引入更高效的查询优化策略、增强安全性以及提高服务的稳定性和可用性。
Presto和Clickhouse在唯品会的成功实践揭示了大型电商企业在大数据分析领域的先进技术和创新解决方案,同时也反映了对高效、可靠和灵活的数据处理平台的持续追求。
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2020-08-20 上传
2022-03-18 上传
2022-03-18 上传
普通网友
- 粉丝: 13w+
- 资源: 9195
最新资源
- JHU荣誉单变量微积分课程教案介绍
- Naruto爱好者必备CLI测试应用
- Android应用显示Ignaz-Taschner-Gymnasium取消课程概览
- ASP学生信息档案管理系统毕业设计及完整源码
- Java商城源码解析:酒店管理系统快速开发指南
- 构建可解析文本框:.NET 3.5中实现文本解析与验证
- Java语言打造任天堂红白机模拟器—nes4j解析
- 基于Hadoop和Hive的网络流量分析工具介绍
- Unity实现帝国象棋:从游戏到复刻
- WordPress文档嵌入插件:无需浏览器插件即可上传和显示文档
- Android开源项目精选:优秀项目篇
- 黑色设计商务酷站模板 - 网站构建新选择
- Rollup插件去除JS文件横幅:横扫许可证头
- AngularDart中Hammock服务的使用与REST API集成
- 开源AVR编程器:高效、低成本的微控制器编程解决方案
- Anya Keller 图片组合的开发部署记录