58大数据平台:架构演进、挑战与未来规划
77 浏览量
更新于2024-08-27
收藏 1.24MB PDF 举报
"《兼顾稳定与性能:58大数据平台的技术演进与实践》是一篇分享58集团在大数据领域技术发展的文章。作者将阐述过去一年半内平台架构的变迁、遇到的问题及应对策略,以及未来的发展方向。文章的核心内容涵盖了58大数据平台的三大层次架构:数据基础平台层、数据应用平台层和数据应用层,以及专门的监控与报警和平台管理模块。
数据基础平台层被细分为四个子模块:1)接入层,主要使用Canal和Sqoop来处理数据库数据,同时Flume也作为重要工具;2)存储层,采用HDFS进行文件存储,HBase用于键值对存储,Kafka作为消息缓存;3)调度层,借助Yarn的统一调度和Kubernetes的容器化管理;4)计算层则集成了MR、Hive、Storm、Spark、Kylin等计算引擎,甚至包括深度学习平台如Caffe和Tensorflow。
数据应用平台的功能包括元信息管理和作业管理,支持交互分析、多维分析和数据可视化;服务于58集团的各种业务需求,如流量统计、用户行为分析等;建立全面的检测报警体系,确保业务、数据和服务的稳定性;以及全面的平台管理,涵盖流程、权限、配额、升级和版本控制等。
文章还详细描述了平台的两条数据流动路径:实时流,数据通过Kafka实时处理后,可能写回Kafka或存入MySQL/HBase;离线路径则涉及HDFS上的批量计算和机器学习处理,数据需经过抽取、清洗等步骤后进入数据仓库,进行深度分析和建模。
通过这些内容,读者可以了解到58大数据平台如何在追求稳定性和性能的同时,不断优化其技术架构,以适应日益增长的数据处理需求,并为集团业务提供强有力的支持。"
2018-06-06 上传
2024-01-18 上传
2021-01-27 上传
2022-11-17 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38708945
- 粉丝: 2
- 资源: 908
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫