Docker+Spark-on-Yarn集群搭建与可视化教程

版权申诉

168 浏览量更新于2024-06-17 收藏 3.29MB DOCX 举报

本文档详细介绍了如何基于Docker技术搭建Spark-on-YARN的大数据集群，并实现可视化管理。首先，从整体上介绍大数据集群部署的基本概念，指出集群构建的核心是利用Docker创建虚拟化的容器环境，通过weave网络工具实现容器间的互联互通，形成一个灵活且可扩展的网络架构。第二部分，专注于Docker的安装和配置。指南首先建议使用软件包管理器apt-get来安装必要的辅助工具，如`software-properties-common`和`python-software-properties`，然后添加dotcloud的LXC-Docker PPA，更新软件源并安装Docker。接着，作者提供了下载并运行Ubuntu 14.04镜像的命令，以便于在新环境中进行操作。对于weave的安装，用户需要通过wget下载并安装weave二进制文件，将其设为可执行权限，以便后续在网络配置中使用。在Hadoop集群的搭建方面，文档涉及了Hadoop 2.6.0 CDH5.5.0的部署，包括基础环境的准备、Hadoop的安装以及高可用性（HA）部署的扩展。此外，还介绍了如何手动删除NameNode节点的操作，以适应不同的运维需求。接下来的章节中，文档指导读者如何将集群部署到master和slave节点上，并设置了网络配置，确保服务能够顺利启动。随后，文档转向了Ambari管理平台的搭建，包括Ambari Server和Client的安装，以及如何通过Ambari进行集群管理和监控。为了提供用户友好的界面，文档还介绍了如何在大数据集群环境中搭建XFCE桌面系统，便于操作员进行日常任务的执行和监控。最后，附录部分列出了相关的下载地址和其他参考资料，方便读者在实际操作中参考和下载所需的软件版本。这份技术手册提供了从基础的Docker和weave配置，到Hadoop和Spark的部署，再到Ambari管理和桌面系统的搭建的一整套详细步骤，适合对大数据集群有深入理解并对Docker技术感兴趣的IT专业人士。

三、 hadoop 集群镜像搭建

1. 搭建准备

进入新建的一个 docker 实例，将上述软件包下载并解压到/opt/目录下，

各软件包安装路径如下

hadoop: /opt/yarn/hadoop-2.6.0-cdh5.5.0

spark: /opt/spark-1.5.0-cdh5.5.0

scala: /opt/scala-2.11.7

2. hadoop 部署

1) 配置 jdk 等环境变量:

#vim /etc/profile 添加如下配置(根据所安装目录修改路径)：

export JAVA_HOME=/usr/local/jdk

export CLASS_PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export SCALA_HOME=/opt/scala

export SPARK_HOME=/opt/spark

export

PATH=$PATH:$JAVA_HOME/bin:$SCALA_HOME/bin:$SPARK_HOME/bi

n:$SPARK_HOME/bin

export HADOOP_DEV_HOME=/opt/yarn/hadoop-2.6.0-cdh5.5.0/

export PATH=$PATH:$HADOOP_DEV_HOME/bin

export PATH=$PATH:$HADOOP_DEV_HOME/sbin

export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}

export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}

export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}

export YARN_HOME=${HADOOP_DEV_HOME}

export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

export HDFS_CONF_DIR=${HADOOP_DEV_HOME}/etc/hadoop

剩余18页未读，继续阅读

悠闲饭团

粉丝: 195
资源: 3404

Docker+Spark-on-Yarn集群搭建与可视化教程

"Docker搭建Spark-on-YARN及可视化桌面技术手册

Docker+Spark-on-Yarn集群搭建指南与桌面可视化

My-Docker-Spark:快速搭建Spark独立集群的容器化方案

基于docker搭建spark-on-yarn及可视化桌面.pdf

基于docker搭建spark on yarn及可视化桌面.doc

java8看不到源码-docker-spark-hive-zeppelin:docker-spark-hive-zeppelin

docker-spark-2.2.1-hadoop-2.7.zip

docker-spark-jupyter

docker-spark-stand-alone：Spark 2.4.7独立docker镜像

docker-compose-viz, Docker 组合图形可视化.zip

最新资源