Hadoop HA集群启动与高可用性验证实验指南

需积分: 5 47 浏览量更新于2024-08-04 收藏 2.06MB PDF 举报

"第6章-Hadoop HA集群启动.pdf" 本章主要讲解了如何启动和测试Hadoop高可用(HA)集群，旨在帮助读者掌握HA集群的启动、测试以及验证其高可用性。实验分为三个部分：高可用集群启动、HA的测试和高可用性验证。 1. 高可用集群启动实验目的是理解和掌握HA集群的手动和自动切换，以及启动流程。实验要求参与者熟悉Linux操作系统命令和Hadoop HA集群的规划部署。实验环境包括3个节点的服务器集群，运行在CentOS 7.4操作系统上，使用ZooKeeper服务，并安装了其他必要的Hadoop组件。启动HA集群的步骤如下： - 启动JournalNode守护进程，它们负责存储HDFS的编辑日志，确保数据的安全。 - 初始化Namenode，这是HDFS的关键组件，负责元数据管理。 - 注册ZNode，这是ZooKeeper中的一个数据节点，用于协调集群中的服务。 - 启动HDFS，即分布式文件系统，提供数据存储服务。 - 启动YARN，它是Hadoop的资源管理系统，负责任务调度和容器管理。 - 同步Master数据，确保主Namenode和备用Namenode的数据一致性。 - 在slave1节点上启动ResourceManager和Namenode进程，实现Namenode的HA。 - 启动MapReduce任务历史服务器，记录和查看MapReduce作业的历史信息。 - 检查端口和进程状态，确保所有服务正常运行。 2. HA的测试实验通过创建文件、传输文件、运行MapReduce任务等操作，来验证HA集群的功能。 - 创建一个测试文件，检查文件系统的基本操作。 - 在HDFS上创建文件夹，测试目录管理功能。 - 将文件传输到HDFS的特定目录，测试文件上传。 - 进入到jar包测试文件目录下，准备运行MapReduce任务。 - 执行MapReduce任务，验证数据处理能力。 - 查看HDFS下的传输结果，确认文件是否成功处理。 - 查看文件测试的结果，确认MapReduce任务执行无误。 3. 高可用性验证实验任务包括自动和手动切换服务状态，以确保在Namenode故障时，集群能无缝地进行故障转移。 - 自动切换服务状态：模拟Namenode故障，观察集群是否能自动选择新的主Namenode。 - 手动切换服务状态：通过命令手动触发Namenode的切换，验证HA机制的有效性。通过这个实验，读者不仅可以了解Hadoop HA集群的启动流程，还能通过实际操作学习到故障转移和恢复机制，这对于构建稳定可靠的Hadoop大数据平台至关重要。

第六章: Hadoop HA 集群启动

/usr/local/src/hadoop/logs/hadoop-root-journalnode-slave2.out

1.5.1.2. 步骤二：初始化 namenode

[hadoop@master ~]$ hdfs namenode -format

1.5.1.3. 步骤三：注册 ZNode

[hadoop@master ~]$ hdfs zkfc -formatZK

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client

environment:java.library.path=/usr/local/src/hadoop/lib:/usr/local/src/hadoop/lib/native

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:java.io.tmpdir=/tmp

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:java.compiler=<NA>

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:os.name=Linux

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:os.arch=amd64

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client

environment:os.version=3.10.0-693.el7.x86_64

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:user.name=root

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client environment:user.home=/root

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Client

environment:user.dir=/usr/local/src/hadoop/etc/hadoop

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Initiating client connection,

connectString=master:2181,slave1:2181,slave2:2181 sessionTimeout=5000

watcher=org.apache.hadoop.ha.ActiveStandbyElector$WatcherWithClientRef@27ce24aa

20/07/01 17:23:15 INFO zookeeper.ClientCnxn: Opening socket connection to server

slave2/192.168.1.8:2181. Will not attempt to authenticate using SASL (unknown error)

20/07/01 17:23:15 INFO zookeeper.ClientCnxn: Socket connection established to

slave2/192.168.1.8:2181, initiating session

20/07/01 17:23:15 INFO zookeeper.ClientCnxn: Session establishment complete on server

slave2/192.168.1.8:2181, sessionid = 0x373099bfa8c0000, negotiated timeout = 5000

20/07/01 17:23:15 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns in ZK.

20/07/01 17:23:15 INFO zookeeper.ZooKeeper: Session: 0x373099bfa8c0000 closed

20/07/01 17:23:15 WARN ha.ActiveStandbyElector: Ignoring stale result from old client with

sessionId 0x373099bfa8c0000

20/07/01 17:23:15 INFO zookeeper.ClientCnxn: EventThread shut down

1.5.1.4. 步骤四：启动 hdfs

[hadoop@master ~]$ start-dfs.sh

剩余10页未读，继续阅读

m0_64975850

粉丝: 0
资源: 5

Hadoop HA集群启动与高可用性验证实验指南

第5章-Hadoop HA集群配置.pdf

spark-3.1.2.tgz & spark-3.1.2-bin-hadoop2.7.tgz.rar

ecplise远程连接hadoop--hdfs java api操作文件.pdf

hadoop大数据生态圈工具配置与应用.pdf

《大数据技术原理与操作应用》第6章习题答案.pdf

CentOS7.x安装hive.pdf

Hbase与Hive的安装参照手册.pdf

【面试宝典】2021年超全超详细的最新大数据开发面试题，附答案解析(一版).pdf

高可用性的HDFS：Hadoop分布式文件系统深度实践

Hadoop大数据生态配置与应用实战指南

最新资源