1. Hadoop2.0相对于Hadoop1.0做了哪些改进?
时间: 2024-09-11 17:10:50 浏览: 88
大数据处理--hadoop2.0核心架构技术
5星 · 资源好评率100%
Hadoop 2.0 相比于 Hadoop 1.0 有许多重要的改进和新特性,以下是一些主要的改进点:
1. YARN(Yet Another Resource Negotiator)的引入:Hadoop 2.0 引入了 YARN,这是一个资源管理平台,允许更有效地分配和管理集群资源,从而允许多个应用程序同时运行。这解决了一代Hadoop中JobTracker的瓶颈问题,因为资源管理和作业调度是耦合在一起的。
2. NameNode高可用性:在Hadoop 1.0中,如果NameNode失败,整个HDFS(Hadoop Distributed File System)就会变得不可用。Hadoop 2.0通过引入高可用性配置,支持多个NameNode并行运行,从而提供故障转移机制,增加了系统的稳定性和可靠性。
3. 新增HDFS联邦:Hadoop 2.0 引入了HDFS联邦,支持多个NameNode在一个HDFS文件系统中并行工作,这意味着可以横向扩展命名空间,提高系统的扩展性和管理大型集群的能力。
4. 资源管理的改进:YARN 的引入改进了资源管理,支持多种计算框架在同一集群上运行,提高了资源利用率和作业调度的灵活性。
5. 引入了MapReduce v2:YARN的引入使得MapReduce计算框架有了重大更新,现在MapReduce可以在YARN的资源管理下运行,允许更多的并发执行和资源优化,同时提供了更好的扩展性和容错性。
阅读全文