CentOS7上搭建Hadoop环境：SSH免密与权限配置

需积分: 15 61 浏览量更新于2024-09-03 收藏 1.07MB PDF 举报

"本资源详细介绍了如何在CentOS7系统上搭建Hadoop环境，并实现SSH免登陆。内容包括操作系统设置、用户权限管理、SSH配置、软件安装以及环境变量的设定等关键步骤。" 在大数据领域，Hadoop是一个开源的分布式计算框架，常用于处理和存储大量数据。本教程聚焦于在Linux（CentOS7）环境中搭建Hadoop环境，同时涵盖了与之相关的其他组件如Spark、Hive、Scala和MySQL的安装。以下是主要的知识点： 1. **操作系统准备**：使用VMware15在Windows10上虚拟化CentOS7作为搭建环境。选择CentOS7是因为它是一个稳定且广泛用于服务器操作系统的Linux发行版。 2. **用户权限与SSH免密码登录**：首先，确保`hadoop`用户具有足够的权限，可以通过修改`/etc/sudoers`文件，添加`hadoopALL=(ALL)ALL`，使`hadoop`用户能以root权限运行命令。同时，为了方便远程操作，需要配置SSH免密码登录，这通常涉及生成公钥和私钥，并将公钥复制到`~/.ssh/authorized_keys`文件中。 3. **软件权限**：在进行操作时，可能会遇到权限不足的问题，例如在执行Scala时。解决方法是通过`chmod 777`命令给予文件执行权限，如在Scala的bin目录下运行`chmod 777 scala`。 4. **环境变量配置**：为确保各组件能正确工作，需要设置环境变量。在`/etc/profile`文件中，定义`JAVA_HOME`指向JDK安装路径，`HADOOP_HOME`指向Hadoop安装路径，并更新`PATH`和`CLASSPATH`，包含Java和Hadoop的可执行文件路径。 5. **软件安装**：除了Hadoop，还需要安装JDK、Scala、HBase、MySQL和Hive。这些组件是大数据生态系统的重要组成部分，JDK是运行Hadoop的基础，Scala是Spark的编程语言，HBase是一个NoSQL数据库，MySQL是传统的关系型数据库，Hive则提供了SQL接口来查询Hadoop上的数据。 6. **系统优化**：在实际部署中，可能还需要考虑网络配置、硬件资源分配、Hadoop配置文件的调整（如`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`等），以及安全性设置，如使用Hadoop的Kerberos认证。通过以上步骤，你将能够成功地在CentOS7系统上构建一个基础的大数据处理环境，为后续的数据分析和处理任务打下坚实的基础。记住，每个步骤都需要细心操作，确保所有配置的正确性，以避免出现不必要的问题。

大数据 Hadoop

1 / 4

1 Cent7 搭建大数据环境

操作系统：在 win10 中虚拟 vmware15，centOS7

安装环境包括 jdk、hadoop、scala、habse、mysql、hvie、spark

1.1 用户权限及 ssh 免密码登录

连接 centos7 的工具最好用 xshell，里面有 gedit、vim 或 vi

1.1.1 赋 hadoop 用户为 root 权限

root/root8888

hadoop/root8888

修改/etc/sudoer 文件，使用 hadoop 可以获得 root 权限（即可以 sudo hadoop）

必须在 root 用户下，因为这个 sudo 文件对普通用户是隐藏的：

[root@127 ~]# vim /etc/sudoers

hadoop ALL=(ALL) ALL

1.1.2 hadoop 无执行 java/scala 权限

[hadoop@localhost ~]$ scala

-bash: /home/hadoop/scala-2.11.8/bin/scala: 权限不够

进入 scala 所在的目录，修改权限：

[hadoop@localhost bin]$ pwd

/home/hadoop/scala-2.11.8/bin

[hadoop@localhost bin]$ chmod 777 scala

[hadoop@localhost bin]$

[hadoop@localhost bin]$ scala

Welcome to Scala 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_161).

Type in expressions for evaluation. Or try :help.

scala>

1.1.3 配置文件 profile 及生效

$sudo vim /etc/profile

unset i

unset -f pathmunge

export JAVA_HOME=/home/hadoop/jdk1.8.0_161

export HADOOP_HOME=/home/hadoop/hadoop-2.7.7

下载后可阅读完整内容，剩余3页未读，立即下载

chengzhb_csdn

粉丝: 1
资源: 12

CentOS7上搭建Hadoop环境：SSH免密与权限配置

第7集-Hadoop环境搭建 - linux（centos7） - 安装配置hive2.1.1.pdf

大数据教程之搭建Hadoop集群.zip_大数据环境搭建hadoop

HDFS与Elasticsearch数据索引与搜索：Elasticsearch Hadoop与ES-Hadoop Connector

Hadoop集群搭建前的软件环境准备

CentOS下搭建和管理Hadoop集群

Hadoop安装与配置：一步步搭建你的Hadoop环境

Hadoop集群搭建与部署指南

spark-3.3.0-bin-hadoop3.tg和spark-3.3.0-bin-without-hadoop.tgz

hadoop集群搭建完整教程（centos7）

spark-3.2.0.tgz和spark-3.2.0-bin-hadoop2.tar.gz的区别

最新资源