TBFS：构建无状态NameNode与独立元数据服务

需积分: 9 133 浏览量更新于2024-07-23 收藏 578KB PDF 举报

“罗李在2009年分享的关于HDFS元数据的独立服务和独立持久化存储的议题，主要介绍了淘宝面对大数据增长时遇到的挑战，包括数据膨胀、文件增多、Block增加、内存压力增大以及一致性问题。现有的HDFS架构依赖于NameNode，存在性能瓶颈和部分元数据未持久化的问题。为解决这些问题，提出了新的架构设计，包括无状态NameNode、独立的元数据管理器（StateManager）和BlockChecker，以及利用Zookeeper进行协调。NameNode的改进在于将内存中的关键数据结构如dir、blocksMap和datanodemap等持久化并分布到第三方系统。” 在应对数据急剧膨胀和文件数持续增长的挑战时，淘宝团队发现Hadoop的分布式文件系统HDFS面临一系列问题。首先，随着Block的数量增加，NameNode的内存需求也急剧上升，因为NameNode需要存储和维护所有Block与DataNode之间的映射关系。此外，保证元数据的一致性带来了显著的性能瓶颈，特别是对于大量的删除、创建和重命名文件操作。同时，由于部分元数据（例如Block到DataNode的映射）没有被持久化，这导致了服务的脆弱性，依赖于NameNode的启动和停止。为了改善这种情况，罗李提出了新的架构设计。这个设计的核心是将NameNode转变为无状态的，这意味着每个NameNode不再需要存储所有的元数据，而是将其分担到多个独立的服务中。这些服务包括： 1. Stateless NameNode：通过这种方式，NameNode可以水平扩展，减轻单点故障的风险。关键数据结构如FSDirectory（文件到块的映射）、BlockMap（块到文件、块到DataNode和DataNode到块的映射）以及DataNodeMap（DataNode的存储ID和相关信息）被移动到第三方系统，并进行持久化。 2. Stateless NameNode集群：多个无状态的NameNode协同工作，共同处理元数据查询和更新请求。 3. StateManager：这是一个独立的服务，负责持久化和管理上述的关键数据结构，可能使用如InnoDB（在FusionIO上运行）这样的数据库系统来提供高可用性和快速访问。 4. BlockChecker：用于检查Block的健康状态，确保数据的完整性。 5. Zookeeper：作为协调组件，确保整个系统的同步和一致性。通过这些改进，新的架构能够更有效地处理大规模的数据和操作负载，降低了对单个节点的依赖，增强了系统的稳定性和可扩展性。此外，元数据的独立持久化存储也提升了服务的恢复能力和容错能力，使得HDFS能够更好地适应大数据环境的需求。

现状

• 集群

– 单个集群1900台机器 1T×12（2T×6）

• 数据量

– 22.28 PB/36.98 PB 60%

• 文件数

– 1亿左右

• Block数

– 1.3亿左右

• Meta存储

– 只持久化了namespace的信息到fsimage

剩余16页未读，继续阅读

baorentou

粉丝: 16
资源: 28

TBFS：构建无状态NameNode与独立元数据服务

淘宝网HDFS元数据的独立服务和独立持久化存储\"分享总结

罗李：构建一个跨机房的Hadoop集群

SpringBoot 20道面试题和答案（2025最新版）.docx

【电力负荷预测】基于matlab灰狼算法优化长短时记忆网络GWO-LSTM电力负荷预测【含Matlab源码 1518期】.zip

SpringBoot-548大学生社团活动平台.zip

线程111111111111111

基于Matlab/Simscape的动静摩擦切换模型（速度转换法）

03_AUTOSAR_in_Practice_InputOutput.pptx

SLAM-Multi-Robot多机器人SLAM系统设计-优质项目实战.zip

动力电池管理系统仿真BMS Battery Simulink电池平衡控制策略模型

最新资源