在MacOS Mojave上成功编译Hadoop2.2.0源码的实验报告

需积分: 5 0 下载量 156 浏览量 更新于2024-11-13 收藏 3.44MB ZIP 举报
资源摘要信息:"java7源码-Compile-Hadoop2.2.0-on-MacOS:也许是第一个(或最笨的)在MacOSMojave上编译Hadoop的" 本篇文档详细记录了作者在MacOS Mojave环境下编译Hadoop 2.2.0的全过程,同时也提到了一些遇到的问题及解决方案。在分析该文档之前,我们首先需要了解文档中提到的相关技术要点。 **Hadoop框架** Hadoop是一个开源的分布式存储与计算框架,它能够处理大规模数据的存储和分析问题。Hadoop的核心是HDFS(Hadoop Distributed File System)和MapReduce。HDFS提供了高吞吐量的数据访问,适合于大规模数据集的应用;MapReduce则是一个编程模型和处理大数据集的相关实现。 **Hadoop的安装** 作者在文档中提到了在MacOS上安装Hadoop的经历,由于使用的是MacOS Mojave系统,作者没有采用虚拟机的方式,而是在本机进行安装。安装过程中,作者遇到了一些由于编译版本不同而产生的问题,以及Hadoop源码中存在的一些bug。这里需要注意的是,Hadoop的编译和安装过程可能会随着版本的更新而有所不同,因此安装指导可能会随时间而过时。 **开发环境配置** 文档中列出了作者在安装Hadoop之前配置的开发环境。具体包括操作系统版本、JDK版本、编译工具版本以及依赖库版本。这些信息对于复现安装过程至关重要。环境配置如下: - MacOS版本:MacOS-10.14 - Java版本:java-1.7.0_80 - CMake版本:3.13.0-rc3 - 编译器版本:clang-1***.**.**.* - Maven版本:3.6.0 - Protocol Buffers版本:2.5.0 **MacOS作为类Unix系统的优势** 文档提到,由于MacOS属于类Unix系统,因此在MacOS上安装和运行Hadoop等需要类Unix环境的程序时,相较于在Linux虚拟机上运行更加高效。这主要是因为虚拟机可能会带来额外的性能开销,从而影响程序运行速度。 **Hadoop在MacOS上的编译问题** 尽管MacOS的类Unix特性为Hadoop的运行提供了便利,但是作者在编译Hadoop源码时遇到了一些特有的问题。这些问题往往与Hadoop源码中的bug有关,或者是因为编译环境的配置不同导致的。文档中并未详细说明具体遇到了哪些编译问题,但强调了作者通过解决这些问题的过程,可能对其他开发者有参考价值。 **总结** 文档不仅是关于如何在MacOS Mojave上编译Hadoop的记录,也是对解决编译过程中遇到的问题的探索和总结。文档中提到的知识点和经验教训对于希望在MacOS上安装和运行Hadoop的开发者来说具有较高的参考价值。 另外,文档中还隐含了一些其他知识点,比如MacOS下的包管理工具(如Homebrew)的使用,以及如何配置和使用Hadoop相关依赖(如Protocol Buffers)。尽管这些内容没有在文档中详尽展开,但它们同样是搭建Hadoop运行环境的一部分。 综上所述,这篇文档不仅记录了作者在特定环境下编译Hadoop的过程,还涉及了与Hadoop相关的系统架构、开发环境配置以及问题解决策略等多方面的知识点。这些内容为后来者提供了宝贵的第一手资料。