天云趋势:Hadoop 2.0 NameNode HA与Federation实战应对银行高可用性需求
76 浏览量
更新于2024-07-15
收藏 352KB PDF 举报
在2012年的背景下,天云趋势针对一家大型国有银行的需求,开始采用Hadoop技术进行历史交易数据备份和查询服务。由于金融行业的高可用性要求,传统的HDFS单一NameNode架构面临着严重的单点故障问题。Apache Hadoop在2012年5月推出了2.0的alpha版本,虽然MapReduce v2(MRv2)尚不成熟,但HDFS的High Availability (HA) 和 Federation功能已经具有实用性。Cloudera随之在7月份发布了包含Hadoop2.0众多新特性和组件的CDH4.0.1,这为解决Hadoop的稳定性提供了新的可能。
Hadoop2.0引入NameNode HA和Federation的主要原因有两个:
1. 解决单点故障问题:
- SecondaryNameNode:作为非实时的辅助工具,它定期合并edits和fsimage,有助于集群启动速度,但并不能提供真正的HA,数据完整性和故障转移能力有限。
- BackupNameNode:虽能在内存中备份NameNode状态,作为热备,但仅在检查点阶段提供服务,不能自动接管。
- 手动迁移至NFS:虽然冷备可以保证元数据安全,但恢复过程需人工干预,无法应对突发情况。
- Facebook AvatarNode:Facebook的方案是一种热备,但在主NameNode失效时,需要人工确认和手动操作,避免脑裂。Hadoop2.0的HA设计汲取了这种理念。
2. 扩展集群容量和性能:
- 单NameNode限制了集群的扩展性,随着数据的增长,传统的架构难以满足处理能力和存储需求。
Hadoop2.0通过引入HA机制,如Active-Active或Active-Passive模式,将NameNode职责分散到多个节点,实现了服务的高可用性。同时,Federation允许数据分布在多个独立的Hadoop集群之间,提高了数据访问的灵活性和性能。通过CDH4.0.1的实现,天云趋势团队得以测试和部署这些新特性,以满足客户对于服务稳定性和可扩展性的严格要求。这一实践展示了Hadoop2.0在解决行业痛点上的进步和应用潜力。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2016-05-30 上传
2014-04-02 上传
点击了解资源详情
weixin_38669091
- 粉丝: 4
- 资源: 871
最新资源
- xdPixelEngine-2
- filter-records:原型制作-DOM中的记录过滤和排序
- 管理系统系列--中医处方管理系统.zip
- LED广告屏控制与显示解决方案(原理图、程序及APK等)-电路方案
- scenic-route:多伦多开放数据绿色路线图应用
- spring-google-openidconnect
- 漏斗面板
- bing-wallpaper
- friendsroom
- 基于M058S的8x8x8 LED 光立方设计(原理图、PCB源文件、程序源码等)-电路方案
- 管理系统系列--综合管理系统.zip
- wisit-slackbot:Slackbot获取有关wisit的信息
- 电子功用-场效应管电容-电压特性测试电路的串联电阻测定方法
- Java-Google-Finance-Api:用于 Google Finance 的 Java API - 使用 Quandl 构建
- test
- 管理系统系列--整合 vue,element,echarts,video,bootstrap(AdminLTE),a.zip