简述Hadoop1.0和2.0显著的区别。
时间: 2024-09-23 22:13:21 浏览: 58
hadoop1.0\2.0学习笔记及
Hadoop 1.0 到 2.0 的升级带来了几个显著的变化:
1. **MapReduce 优化**:Hadoop 2.0 引入了 YARN (Yet Another Resource Negotiator) 平台,取代了之前单一的角色 MapReduce 负责资源管理和任务调度,使得系统更易扩展和容错。这使得用户可以并行提交作业,而不需要像 Hadoop 1.x 那样依赖单个 MR 进程。
2. **NameNode HA and Federation**:Hadoop 2.0 支持 NameNode 高可用性和命名空间分片(Federation),这意味着如果主 NameNode 出现故障,备 NameNode 可以接管,而且数据可以在多个独立集群之间共享,提高了可靠性。
3. **Secondary Namenodes**:引入了辅助 NameNodes 来备份元数据,减轻了主 NameNode 的压力,并提高了数据一致性检查的速度。
4. **改进的文件系统**:Hadoop 2.0 提供了一个新的文件系统接口 HDFS 2.0,支持更细粒度的复制策略和更有效的数据块管理。
5. **Resource Management**:YARN 通过 Resource Manager 和 Node Manager 分离了资源管理和应用程序管理,允许更精细的资源分配和调度。
6. **生态系统增强**:Hadoop 2.0 期间,社区对生态系统进行了扩展,包括 Hive、Pig、Mahout等工具的改进和新组件的引入。
阅读全文