Hadoop MRV2集群安装实战：从零到集群

5星 · 超过95%的资源需积分: 0 35 浏览量更新于2024-07-21 收藏 560KB PDF 举报

"本文档详述了如何在实际环境中安装和配置Hadoop集群，特别是针对MRV2（YARN）架构。集群由三台服务器组成，一台作为主节点，运行namenode、secondarynamenode和resourcemanager，其余两台作为工作节点，运行datanode和nodemanager。文档还提到了网络设计、NFS配置以实现SSH无密登录，以及后续的Hadoop组件安装和配置步骤。" 在构建Hadoop集群时，首先需要规划网络布局。在这个例子中，三台服务器被分配了不同的IP地址，其中一台作为主节点，拥有特定的主机名（namenode），其他两台作为工作节点，主机名分别为datanode1和datanode2。这种配置允许主节点集中管理整个集群，而工作节点则负责数据存储和处理任务。接着，文档建议配置NFS（Network File System）以简化SSH（Secure Shell）设置。NFS允许在不同机器之间共享文件系统，使得主节点可以无密码登录其他节点，这对于集群管理和维护非常方便。在namenode上，需要创建一个共享目录（例如/home/hadoop），然后在/etc/exports文件中添加相应的规则，指定允许哪些IP访问该目录，并设置权限。完成配置后，重启NFS服务并检查共享状态，确保设置正确。完成NFS配置后，还需要在所有节点上设置SSH无密登录。这可以通过在主节点生成密钥对，然后将公钥复制到其他节点的authorized_keys文件中来实现。这种方法不需要NFS，但文档中提供了使用NFS共享密钥的替代方案。接下来的步骤通常包括在每个节点上安装Java环境、下载和解压Hadoop软件包、配置Hadoop配置文件（如hdfs-site.xml、yarn-site.xml和core-site.xml），以及初始化HDFS和YARN。此外，还需要设置环境变量、启动和格式化HDFS，以及启动YARN和其他相关服务。在集群运行过程中，可能会遇到各种问题，如网络通信问题、数据块丢失或不一致、资源调度问题等。文档中提到会提供常见问题的解决方案，帮助用户解决这些问题，确保集群能够稳定运行。搭建Hadoop集群是一项复杂但重要的任务，它涉及到网络规划、安全设置、软件配置等多个方面。遵循本文档的步骤，用户可以逐步构建自己的Hadoop集群，为大数据处理和分析提供基础平台。在实际操作中，需要仔细阅读和理解每个步骤，以确保集群的正确性和可靠性。

[hadoop@datanode1 ~]$ mkdir .ssh

[hadoop@datanode1 ~]$ chmod 700 .ssh #必须要修改，否则将不能实现免密功能

(3) 以 hadoop 用户登录 namenode，进行如下操作进行密钥分发：

[hadoop@namenode ~]$cd .ssh

[hadoop@namenode .ssh]$scp authorized_keys

hadoop@192.168.100.110:/home/hadoop/.ssh

[hadoop@namenode .ssh] scp authorized_keys

hadoop@192.168.100.111:/home/hadoop/.ssh

按照提示输入各机器上 hadoop 用户的密码完成操作。

需要注意的是在几个节点上分别检查 authorized_keys 的权限，如果不具有 644 权限，

则需要修改。

为验证 SSH 配置是否正确，需要从 namenode 的 hadoop 用户分别进行 ssh 登录。

[hadoop@namenode ~]ssh hadoop@192.168.100.110

[hadoop@namenode ~]ssh hadoop@192.168.100.111

六、安装 Hadoop

从 Apache 发布页 http://hadoop.apache.org/core/release.html 下载 Hadoop 最新的稳定的

发布版本，解压 Hadoop 发布版的内容到/usr/local 目录下。

我下载的版本是 2.5.2。

注意：Hadoop 不安装在 Hadoop 用户的主目录，因为主目录可能已经被安装在 NFS 上。

首先完成 namenode 节点的安装和配置后，再把 hadoop 文件拷贝到其他的节点。

(一) 上传、解压和修改安装目录属主和属组

在 namenode 以 root 用户登录完成如下操作：

#cd /usr/local

# tar xzf hadoop-2.5.2.tar

修改解压后目录的属主和数组：

#chown –R hadoop:hadoop hadoop-2.5.2/

切换为 hadoop 用户：

#cd hadoop-2.5.2

#mkdir temp

(二) 对 Hadoop 进行配置

以 Hadoop 用户登录后，对相关配置进行设置

(1) 在 hadoop 用户主目录下，设置环境变量

[hadoop@namenode ~]$vi .bash_profile

其中增加如下几个环境变量：

export MY_HADOOP =/usr/local/hadoop-2.5.2

export PATH=$PATH:${MY_HADOOP} /bin:${MY_HADOOP}/sbin:/usr/java/jdk1.7.0_75/bin

保存退出后，使用 source 使环境变量生效。

[hadoop@namenode ~]$source .bash_profile

(2) 修改配置文件

剩余16页未读，继续阅读

zhangbaolin

粉丝: 104
资源: 33

Hadoop MRV2集群安装实战：从零到集群

hadoop集群安装步骤

hadoop集群安装笔记

hadoop集群安装手册

Hadoop集群安装和搭建（全面超详细的过程） 文章目录 Hadoop集群安装和搭建（全面超详细的过程） 前言 一、虚拟机的安装

hadoop 集群安装手册

hadoop集群安装过程

Linuxhadoop集群安装

hadoop集群安装配置

hadoop集群安装eclipse

储能双向变流器，可实现整流器与逆变器控制，可实现整流与逆变，采用母线电压PI外环与电流内环PI控制，可整流也可逆变实现并网，实现能量双向流动，采用SVPWM调制方式 1.双向 2.SVPWM 3.双

最新资源

Hadoop集群安装和搭建（全面超详细的过程）文章目录 Hadoop集群安装和搭建（全面超详细的过程）前言一、虚拟机的安装