腾讯大数据集群演进:Hadoop高可用与高扩展性实践
需积分: 13 176 浏览量
更新于2024-07-20
收藏 656KB PDF 举报
“腾讯HADOOP集群实践主要讲述了腾讯在构建和优化大规模Hadoop集群方面的经验,包括集群的架构、面临的挑战以及解决方案。集群涉及到多个业务部门,如SNG、OMG、IEG等,旨在实现数据共享、计算资源的集中管理和高效利用。集群规模不断扩大,从200台到4000台,但同时也遇到了NameNode无容灾、JobTracker调度效率低下等问题。为解决这些问题,腾讯考虑了Yarn和Corona等方案,最终选择了JobTracker分散化来提高集群的高可用性、高效性和扩展性。”
腾讯在大数据处理上采用了Hadoop作为基础架构,构建了大规模的Hadoop集群,服务于公司内部的多个业务部门,如社交网络、在线广告、电商和视频等。这个集群的构成包括数据仓库、数据应用、数据采集与分发、实时计算平台等多个部分,实现了海量数据的存储和计算。其中,Lhotse统一调度系统负责资源管理和作业调度,而TDW(Tencent Data Warehouse)则作为重要的数据仓库组件,处理海量数据的存储和分析。
随着集群规模的扩大,腾讯遇到了一系列技术挑战。NameNode是Hadoop HDFS的关键组件,负责元数据管理,但在集群中没有容灾机制,一旦出现问题,可能会导致一个小时的数据丢失,并且NameNode的重启过程耗时较长,不支持灰度变更。此外,JobTracker作为作业调度器,其效率低下,影响了集群的扩展性。
为了解决上述问题,腾讯研究了不同的解决方案,比如Yarn(Yet Another Resource Negotiator)和Corona,两者都旨在改进JobTracker的功能,提供更好的资源管理和任务调度。经过评估,腾讯决定采用JobTracker分散化策略,将JobTracker的功能拆分为资源管理和任务调度两个独立的部分,这样可以实现JobTracker的平行扩展,提高整个系统的高可用性、高效性和扩展性。新的架构中,Cluster Manager负责资源管理,而Task Tracker则专注于任务调度和管理,这样的设计使得任务调度更加精细化,提升了整体性能。
此外,腾讯还构建了数据开发者平台和数据应用门户,以支持自助提取与分析,促进数据规范化管理,并通过TRC实时计算平台进行实时采集和流式计算,以满足实时业务需求。通过这样的大数据平台,腾讯能够提供精准推荐模型,支持社交广告、电商等业务的精准营销。
腾讯HADOOP集群实践展示了大型企业如何面对和解决大数据处理中的挑战,通过技术创新和架构优化,实现高效、稳定和灵活的大数据处理环境,为业务发展提供强大支撑。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-03-02 上传
2014-08-20 上传
2014-05-29 上传
140 浏览量
2014-05-29 上传
点击了解资源详情
yanwei19911001
- 粉丝: 1
- 资源: 6
最新资源
- C语言数组操作:高度检查器编程实践
- 基于Swift开发的嘉定单车LBS iOS应用项目解析
- 钗头凤声乐表演的二度创作分析报告
- 分布式数据库特训营全套教程资料
- JavaScript开发者Robert Bindar的博客平台
- MATLAB投影寻踪代码教程及文件解压缩指南
- HTML5拖放实现的RPSLS游戏教程
- HT://Dig引擎接口,Ampoliros开源模块应用
- 全面探测服务器性能与PHP环境的iprober PHP探针v0.024
- 新版提醒应用v2:基于MongoDB的数据存储
- 《我的世界》东方大陆1.12.2材质包深度体验
- Hypercore Promisifier: JavaScript中的回调转换为Promise包装器
- 探索开源项目Artifice:Slyme脚本与技巧游戏
- Matlab机器人学习代码解析与笔记分享
- 查尔默斯大学计算物理作业HP2解析
- GitHub问题管理新工具:GIRA-crx插件介绍