作业帮Doris:实时数仓实践与业务优化
版权申诉
114 浏览量
更新于2024-07-05
收藏 1.15MB PDF 举报
"作业帮Doris在数仓中的实践报告详细探讨了作业帮公司在构建实时数仓系统时采用的创新解决方案和实践经验。该报告由糜利敏撰写,重点关注了业务需求、架构设计、以及Doris技术在其中的作用。
首先,报告介绍了业务与背景,强调了原有的业务支持模式存在问题,如开发成本高、重复建设、接口非标准化,以及使用Spark和ES时存在的学习曲线陡峭、性能不佳和稳定性问题。这促使公司转向寻求更高效、可复用的解决方案。
Doris的引入解决了这些问题。DorisOnES作为一种关键组件,将数据摄入、实时查询和数据清洗整合在统一的平台上,通过OpenAPI和Flink-Sql提供强大的查询能力。Flume和Canal被用于数据传输,确保数据的实时性。Doris的优势在于其易运维、社区活跃以及对Mysql接口的支持,这显著提升了开发效率和查询性能。
报告还展示了从过去到现在的转变,包括技术选型的变化,如放弃API和ES,转而专注于Doris和DorisOnES。通过基础数据的Doris写入,业务线可以基于SQL进行高效查询,查询速度得到了显著提升。例如,处理千万级数据的查询时间从原来的小时级别缩短到了分钟甚至秒级别,极大地提高了数据分析的响应速度。
此外,报告指出Doris的稳定性和社区支持使得公司的运维成本降低,且在半年内成功应用于7个以上的业务线,处理了近1TB的数据,期间未发生重大故障(P2及以上级别)。这表明Doris在实际生产环境中表现出色,成为推动作业帮业务增长的关键工具。
总结来说,这份报告深入展示了作业帮如何通过Doris技术优化数仓架构,解决传统方法的痛点,并实现显著的性能提升和运维效率改善,是值得其他企业借鉴的最佳实践案例。"
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-09-19 上传
2022-03-18 上传
2023-07-04 上传
2022-03-18 上传
2022-11-18 上传
2024-04-02 上传
Build前沿
- 粉丝: 791
- 资源: 2125
最新资源
- MATLAB实现小波阈值去噪:Visushrink硬软算法对比
- 易语言实现画板图像缩放功能教程
- 大模型推荐系统: 优化算法与模型压缩技术
- Stancy: 静态文件驱动的简单RESTful API与前端框架集成
- 掌握Java全文搜索:深入Apache Lucene开源系统
- 19计应19田超的Python7-1试题整理
- 易语言实现多线程网络时间同步源码解析
- 人工智能大模型学习与实践指南
- 掌握Markdown:从基础到高级技巧解析
- JS-PizzaStore: JS应用程序模拟披萨递送服务
- CAMV开源XML编辑器:编辑、验证、设计及架构工具集
- 医学免疫学情景化自动生成考题系统
- 易语言实现多语言界面编程教程
- MATLAB实现16种回归算法在数据挖掘中的应用
- ***内容构建指南:深入HTML与LaTeX
- Python实现维基百科“历史上的今天”数据抓取教程