淘宝云梯:大规模分布式数据处理实践与改造
需积分: 1 154 浏览量
更新于2024-07-31
收藏 524KB PDF 举报
"淘宝分布式数据处理实践"
在淘宝的分布式数据处理实践中,云梯是一个关键的组件,它是一个大规模的数据处理平台。云梯1是该系统的早期版本,拥有9.3PB的总容量,其中77.09%的容量被有效利用。这个系统由1100台机器组成,其中包括8CPU(HT)、48G内存的Master节点和异构配置的Slave节点。Slave节点有不同的配置,包括8CPU/8CPU(HT)、16G/24G内存、不同数量的SATAJBOD磁盘和插槽。每天有大约18000道作业在云梯1上运行,处理约500TB的数据,服务于474名用户和38个用户组。
云梯1的Hadoop版本基于0.19.1,并应用了大量补丁,这些补丁来自Hadoop的多个后续版本(如0.19.2, 0.20, 0.21),同时包含一些自研的改进。为了简化管理,客户端和服务端的代码开发被分离,仅由云梯管理员负责服务端的升级,保证向下兼容。
云梯在功能上进行了扩展,以满足淘宝的需求。安全性方面,通过密码认证(hadoop.job.ugi)和正在开发中的扩展ACL来增强用户访问控制。调度器基于FairScheduler进行了改造,允许通过网页动态调整slots,确保各组公平使用资源。此外,云梯还实现了Slave单磁盘容错功能,即使DataNode或TaskTracker的磁盘出现故障,系统也能继续运行,减少数据处理中断。
Master节点的容灾方案设计得相当周到,包括3个Master节点和1个Standby节点,它们的配置文件一致并存储在SVN中,同时采用VirtualIP来实现NameNode和JobTracker的高可用性。这一设计增强了系统的稳定性和可靠性。
Hive作为数据处理的重要工具,在淘宝也有广泛应用。虽然原文没有深入讨论Hive的具体实践和改造,但可以推测淘宝可能对Hive进行了优化,以适应其大规模的数据处理需求和特定的业务场景。
分布式数据仓库的构思可能是为了更高效地管理和分析存储在云梯中的海量数据。这可能涉及到数据的组织、查询优化以及与各种应用系统的集成,例如搜索、推荐系统、广告和BI等。
淘宝的分布式数据处理实践展示了如何在一个大型电子商务环境中,有效地管理和处理海量数据,通过扩展和改造Hadoop及其生态系统,以及建立健壮的容错机制,保证了数据处理的效率和系统的稳定性。
376 浏览量
2010-11-22 上传
点击了解资源详情
点击了解资源详情
2015-04-16 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
Lizhi1114
- 粉丝: 4
- 资源: 21
最新资源
- 先进算法讲义-中科大.pdf 需要的下吧
- TD-SCDMA Principle -李世鹤
- rhce5 启动引导troubleshooting实验笔记
- 软件体系结构(ppt版)
- C和C++嵌入式系统编程
- Java企业版中性能调节的最佳实践.pdf
- Log4j中文手册2006_04_07_205056_ZCxoePRlHJ_2.pdf
- AutoCADAutoCAD 2005中文版是美国AutoDesk公司推出的AutoCAD软件的最新版本,它在以前版本的强大功能之上又增加了新的功能。通过本章的学习,读者将对AutoCAD 2005中文版有一个整体上的了解,学会安装和启动的方法,初步了解AutoCAD 2005中文版的界面组成。
- 全国等级考试 二级vf机试题
- The Definitive Guide to Grails Second Edition
- LINUX电子书
- IGBT 应用系统资料!
- 单片机恒温箱温度控制系统的设计
- ARM的嵌入式系统硬件结构设计经典
- MATLAB偏微分方程工具箱简介
- TestLink1.7RC3使用说明书.doc