Ambari优化：实战线上Hadoop游戏数据集群高可用与资源管理

160 浏览量更新于2024-08-28 收藏 621KB PDF 举报

"本文探讨了在实际生产环境中对Ambari进行线上Hadoop游戏数据集群接管的实践经验。首先，作者介绍了当前Hadoop集群的背景，它在数据接入存储、离线计算以及自研系统的底层服务中扮演核心角色，使用的Hadoop版本为2.7.3。HDFS采用高可用模式HAwithQJM，通过StandbyNamenode热备和多节点间的元数据同步，降低了单点故障对集群服务的影响，确保了高可用性。此外，Yarn框架被用于资源分配和作业调度，采取了公平调度策略，根据业务线的成本投入定制了不同的作业队列，保证资源的合理使用。 Yarn中的FairScheduler通过定义参数如最大并行作业数、资源限制等，实现了作业的公平竞争。Hive作为数据仓库工具，升级到2.1版本后，提供了更好的并发支持、身份认证功能以及内存计算能力，极大地提升了数据处理效率和服务水平。Flume+等其他工具可能也融入了数据采集和传输的部分工作，共同构建了一个稳定且高效的数据处理和存储环境。在Ambari接管过程中，可能会遇到的问题包括系统迁移风险、兼容性挑战、性能优化等。解决这些问题需要细致的规划，如数据备份和恢复策略，服务升级的顺序控制，以及对新旧系统性能的监控和调整。通过本文的分享，读者可以了解到如何在实际场景下有效地利用Ambari管理Hadoop集群，确保业务的连续性和数据的安全性。"

图4 Ambari整体架构图

Ambari Web: 用户交互界面，通过HTTP发送使用Rest Api与Ambari Server进行交互。

Ambari Server: Web服务器，用于和Web、Agent进行交互并且包含了Agent的所有控制逻辑，Server产生的数据存储在DB

中。

Ambari Agent: 守护进程，主要包含节点状态与执行结果信息汇报Server以及接受Server操作命令的两个消息队列。

Host: 安装实际大数据服务组件的物理机器，每台机器都有Ambari Agent服务与Metrcis Monitor守护进程服务。

Metrics Collector: 主要包括将Metrics Monitor汇报的监控信息存储到Hbase，以及提供给Ambari Server的查询接口。

Ambari整体管理集群方面以Ambari Server 为核心，维护着一个FSM有限状态机，包含平台中所有部署Agent并注册的节点、

部署的服务与组件的状态变化信息、配置文件并且持久化在Ambari Server端的DB中。对外一方面通过restApi接口方式与

Ambari Web交互，一方面接受来自Agent的定时心跳请求，所有交互信息中包含了节点状态、事件信息、动作命令中其中至

少一种，由Ambari Server统一协调命令和维护状态结果，然后给Agent下发的相关command，Ambari Agent接受命令执行相

关逻辑并返回状态结果。Ambari整体监控方面通过Ambari Server获取Ambari Metrics Collector中聚集后的从各个节点Ambari

Metrics Monitor上报的单节点监控指标数据，在Ambari Web中给出图形化的展示。

Ambari是HDP数据平台套件的一部分，HDP是Ambari管理集群的技术栈基础。HDP即Hortonworks Data Platform，是

Hortonworks完全开源以Yarn为核心整合Apache Hadoop技术的一个安全的企业级数据平台，HDP涵盖了几乎所有Hadoop的

数据离线处理技术，以及最新的实时处理技术满足用户需求，如下图所示，其2017年开源的HDP v2.6正好支持Hadoop

v2.7.3。

图5 HDP数据平台技术涵盖

Ambari支持对HDP的供应或者说Ambari基于HDP数据平台，下面是几个核心概念：

剩余11页未读，继续阅读

weixin_38714532

粉丝: 2
资源: 952

Ambari优化：实战线上Hadoop游戏数据集群高可用与资源管理

ambari安装及搭建hadoop大数据集群

Linux运维-Hadoop集群之ambari实践-13hadoop集群启动.mp4

Linux运维-Hadoop集群之ambari实践-14hadoop集群验证.mp4

Linux运维-Hadoop集群之ambari实践-11hadoop软件包准备.mp4

Linux运维-Hadoop集群之ambari实践-28ambari数据导入数据库.mp4

Ambari搭建HadoopAmbari搭建Hadoop_.docx

Centos7.2安装Ambari2.4.2+HDP2.5.3搭建Hadoop集群

Ambari实战：线上Hadoop集群监控与管理

HDP集群搭建与管理：Ambari引导下的Hadoop部署

"Ambari 2.1.2：Hadoop 生态圈集群管理工具简介与安装指南

最新资源