hadoop 群集部署与运维实践

hadoop

需积分: 10 55 浏览量更新于2023-05-25 收藏 722KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

1/23

hadoop2.7

实验环境说明：

192.168.100.1 node1.robin.com

192.168.100.2 node2.robin.com

192.168.100.3 node3.robin.com

192.168.100.4 node4.robin.com

192.168.100.5 node5.robin.com

192.168.100.6 node6.robin.com

node1与node2主机角色分配：NameNode、DFSZKFailoverController；需要安装软件有：JDK、Hadoop2.7.1

nod3主机角色分配：ResourceManager；需要安装软件有：JDK、Hadoop2.7.1

node4、node5、node6主机角色分配：JournalNode、DataNode、NodeManager、QuorumPeerMain；需要安装软件有：JDK、

Hadoop2.7.1、zookeeper3.4.6

一、配置本地解析：

[root@node1~]# cat /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.100.1 node1.robin.com

192.168.100.2 node2.robin.com

192.168.100.3 node3.robin.com

192.168.100.4 node4.robin.com

192.168.100.5 node5.robin.com

192.168.100.6 node6.robin.com

[root@node1 ~]#

for ((x=1;x<=6;x++));do scp /etc/hosts node$x.robin.com:/etc/ ; done

二、安装jdk

[root@node1 ~]# for ((x=1;x<=6;x++));do scp jdk-7u45-linux-x64.rpm node$x.robin.com:/root/ ; done

在所有节点上都rpm -ivh jdk-7u45-linux-x64.rpm

编辑/etc/profile文件，如下：

[root@node1 ~]# tail -3 /etc/profile

export JAVA_HOME=/usr/java/jdk1.7.0_45

export HADOOP_HOME=/opt/hadoop

export PATH=$JAVA_HOME/jre/bin:$JAVA_HOME/bin:$HADOOP_HOME/bin:$PATH

[root@node1 ~]#

for((x=1;x<=6;x++));do scp /etc/profile node$x.robin.com:/etc/ ; done

所有节点都source /etc/profile，并使用java -version验证jdk的新版本

三、新建立hadoop用户，配置ssh 互信

所有节点都新建hadoop用户，如下：

useradd hadoop

echo "redhat" | passwd --stdin hadoop

然后在node1主机上操作如下：

[root@node1 ~]# su - hadoop

[hadoop@node1 ~]$ ssh-keygen

Generating public/private rsa key pair.

Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):

Created directory '/home/hadoop/.ssh'.

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /home/hadoop/.ssh/id_rsa.

Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.

The key fingerprint is:

41:1a:d7:b1:df:bc:1d:bc:8e:ec:f9:ef:c5:48:f8:90 hadoop@node1.robin.com

The key's randomart image is:

+--[ RSA 2048]----+

| . o... |

| = .. |

| . . . |

| . . =. |

| S E +o |

| + =o|

| +.+|

| . + .|

| .=.++|

+-----------------+

[hadoop@node1 ~]$

ssh-copy-id -i node1.robincom

The authenticity of host 'robin (192.168.1.1)' can't be established.

RSA key fingerprint is 44:69:99:88:ac:45:67:7c:fe:95:b0:93:7e:af:38:4d.

Are you sure you want to continue connecting (yes/no)? yes

Warning: Permanently added 'robin,192.168.1.1' (RSA) to the list of known hosts.

hadoop@robin's password:

Now try logging into the machine, with "ssh 'robin'", and check in:

2/23

.ssh/authorized_keys

to make sure we haven't added extra keys that you weren't expecting.

[hadoop@node1 ~]$

[hadoop@node1 ~]$ for((x=2;x<=6;x++));do scp -r .ssh node$x.robin.com:~ ; done

The authenticity of host 'node2 (192.168.1.2)' can't be established.

RSA key fingerprint is a7:24:ed:2e:56:5f:5c:f7:f4:fe:c0:ee:ef:51:a1:2d.

Are you sure you want to continue connecting (yes/no)? yes

Warning: Permanently added 'node2,192.168.1.2' (RSA) to the list of known hosts.

hadoop@node2's password:

id_rsa.pub 100% 407 0.4KB/s 00:00

known_hosts 100% 799 0.8KB/s 00:00

authorized_keys 100% 407 0.4KB/s 00:00

id_rsa 100% 1675 1.6KB/s 00:00

The authenticity of host 'node3 (192.168.1.3)' can't be established.

RSA key fingerprint is 00:38:94:de:68:83:5e:48:77:83:e0:7d:14:33:a1:91.

Are you sure you want to continue connecting (yes/no)?

yes

Warning: Permanently added 'node3,192.168.1.3' (RSA) to the list of known hosts.

hadoop@node3's password:

id_rsa.pub 100% 407 0.4KB/s 00:00

known_hosts 100% 1198 1.2KB/s 00:00

authorized_keys 100% 407 0.4KB/s 00:00

id_rsa 100% 1675 1.6KB/s 00:00

The authenticity of host 'node4 (192.168.1.4)' can't be established.

RSA key fingerprint is 84:9a:aa:db:b2:2c:38:bb:5f:32:61:b5:e8:c3:9e:8a.

Are you sure you want to continue connecting (yes/no)?

yes

Warning: Permanently added 'node4,192.168.1.4' (RSA) to the list of known hosts.

hadoop@node4's password:

id_rsa.pub 100% 407 0.4KB/s 00:00

known_hosts 100% 1597 1.6KB/s 00:00

authorized_keys 100% 407 0.4KB/s 00:00

id_rsa 100% 1675 1.6KB/s 00:00

The authenticity of host 'node5 (192.168.1.5)' can't be established.

RSA key fingerprint is e2:6a:3f:08:2b:9b:af:39:54:ff:47:5f:a9:ee:af:06.

Are you sure you want to continue connecting (yes/no)?

yes

Warning: Permanently added 'node5,192.168.1.5' (RSA) to the list of known hosts.

hadoop@node5's password:

id_rsa.pub 100% 407 0.4KB/s 00:00

known_hosts 100% 1996 2.0KB/s 00:00

authorized_keys 100% 407 0.4KB/s 00:00

id_rsa 100% 1675 1.6KB/s 00:00

The authenticity of host 'node6 (192.168.1.6)' can't be established.

RSA key fingerprint is 9d:27:25:89:50:cd:a3:53:b1:0b:56:d0:cd:7d:eb:ae.

Are you sure you want to continue connecting (yes/no)?

yes

Warning: Permanently added 'node6,192.168.1.6' (RSA) to the list of known hosts.

hadoop@node6's password:

id_rsa.pub 100% 407 0.4KB/s 00:00

known_hosts 100% 2395 2.3KB/s 00:00

authorized_keys 100% 407 0.4KB/s 00:00

id_rsa 100% 1675 1.6KB/s 00:00

[hadoop@node1 ~]$

各节点相互ssh登录，测试是否互信。

四、配置zookeeper cluster

[root@node1 ~]# for((x=4;x<=6;x++));do scp zookeeper-3.4.6.tar.gz node$x.robin.com:/tmp ;done

root@node4's password:

zookeeper-3.4.6.tar.gz 100% 17MB 16.9MB/s 00:01

root@node5's password:

zookeeper-3.4.6.tar.gz 100% 17MB 16.9MB/s 00:00

root@node6's password:

zookeeper-3.4.6.tar.gz 100% 17MB 16.9MB/s 00:01

[root@robin ~]#

[root@node5 ~]#

chown hadoop.hadoop /opt

[root@node5 ~]# su - hadoop

[hadoop@node5 ~]$ tar xfz /tmp/zookeeper-3.4.6.tar.gz -C /opt/

[hadoop@node5 ~]$

[hadoop@node5 ~]$ cd /opt/

[hadoop@node5 opt]$ ls

rh zookeeper-3.4.6

[hadoop@node5 opt]$ mv zookeeper{-3.4.6,}

[hadoop@node5 opt]$ ls

rh zookeeper

3/23

[hadoop@node5 opt]$ ls zookeeper/conf/

configuration.xsl log4j.properties zoo_sample.cfg

[hadoop@node5 opt]$ cp zookeeper/conf/zoo{_sample,}.cfg

[hadoop@node5 opt]$ vim zookeeper/conf/zoo.cfg

[hadoop@node5 opt]$ grep -P -v "^($|#)" zookeeper/conf/zoo.cfg

tickTime=2000

这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳。

initLimit=10

这个配置项是用来配置 Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器的客户端，而是 Zookeeper 服务器

集群中连接到 Leader 的 Follower 服务器),初始化连接时最长能忍受多少个心跳时间间隔数.当已经超过 10个心跳的时间（也就是 tickTime）

长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 10*2000=20 秒

syncLimit=5

这个配置项标识 Leader 与 Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就

是 5*2000=4 秒

dataDir=

/opt/zookeeper/data

顾名思义就是 Zookeeper 保存数据的目录，默认情况下，Zookeeper 将写数据的日志文件也保存在这个目录里。

clientPort=2181

这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求。

server.1=node4.robin.com:2888:3888

server.2=node5.robin.com:2888:3888

server.3=node6.robin.com:2888:3888

server.A=B：C：D：其中 A 是一个数字，表示这个是第几号服务器；B 是这个服务器的 ip 地址；C 表示的是这个服务器与集群中的

Leader 服务器交换信息的端口；D 表示的是万一集群中的 Leader 服务器挂了，需要一个端口来重新进行选举，选出一个新的 Leader，而这

个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式，由于 B 都是一样，所以不同的 Zookeeper 实例通信端口号不

能一样，所以要给它们分配不同的端口号。

[hadoop@node5 opt]$

mkdir /opt/zookeeper/data

[hadoop@node5 opt]$ echo 2 > /opt/zookeeper/data/myid #创建对应的服务器编号

[root@node4 ~]# chown hadoop.hadoop /opt

[root@node6 ~]# chown hadoop.hadoop /opt

[hadoop@node5 opt]$ scp -r /opt/zookeeper node4.robin.com:/opt/

[hadoop@node5 opt]$ scp -r /opt/zookeeper node6.robin.com:/opt/

[root@node4 ~]# su - hadoop

[hadoop@node4 ~]$ echo 1 > /opt/zookeeper/data/myid

[root@node6 ~]# su - hadoop

[hadoop@node6 ~]$ echo 3 > /opt/zookeeper/data/myid

[hadoop@node4 ~]$ /opt/zookeeper/bin/zkServer.sh start

JMX enabled by default