实验室环境下 hadoop 集群配置
一、环境说明
实验室中多台机器都属于同一局域网,主机的操作系统多为 windows 系统,而
hadoop 要在 linux 环境下配置,因此我们选用了
host(windows7)+Vmware(ubuntu)的方式进行了实验性的配置。
机器三台,分别做 namenode(12G 内存 八核处理器 1TB 硬盘)和两个
datanode(4G 内存 双核处理器 1TB 硬盘)。下面进入正式的配置过程。
二、虚拟机的安装及上网方式的选择
虚拟机上网方式,选择桥接。
虚拟机器上安装 linux(ubuntu)系统,上网方式:选择有线网络,手动设置 IP。
网关。IP 与主机网段相同。网关与主机相同,DNS 与主机相同。
我们这次试验中 机器的配置的 ip 结果如下
Datanode : 219.245.72.244
Namenode1: 219.245.72.242
Namenode2: 219.245.72.243
这是如果网络是好的,各个 linux 系统之间可以 ping 通。
三、安装 ssh 服务
在安装之前把虚拟机的上网方式改成 Nat,Bridge 方式不能直接上网。Linux 系
统设置成自动获取 ip。
下面安装 openssh-server ,并配置各节点的公钥私钥
对于每个节点:
安装 openssh-server :sudo apt-get install openssh-server
创建公钥私钥: ssh-keygen –t rsa
期间会要求输入一些信息,直接按回车就可以。这样,在默认的路径(其中
njust 是 当 前用户名) /home/lilin/.ssh 目 录 下 创 建 私 钥 id_rsa 和 一 个 公 钥
id_rsa.pub 。
对于 datanode 节点: