Linux环境下完全分布式安装Hive 2.3.6教程

需积分: 21 3 下载量 27 浏览量 更新于2024-09-03 收藏 882KB DOCX 举报
"这篇文档详细记录了在Linux环境下安装Hive 2.3.6的完全分布式过程,特别强调了与Hadoop完全分布式集群和MySQL 5.5的配合使用。作者鼓励读者提出意见和指出错误,承诺会及时改正,并且要求在引用时标明出处。" 在安装Hive 2.3.6之前,你需要有一个运行中的Hadoop完全分布式集群以及MySQL 5.5作为元数据存储。以下是对整个安装过程的详细说明: 1. Hive元数据库的建立 - 首先,你需要登录到MySQL命令行客户端。有两种方法:一是通过`mysql -u root -p`然后输入密码;二是输入`mysql -u root -p`后回车输入密码。 - 在MySQL中创建名为“hive”的数据库,用于存储Hive的元数据。使用`CREATE DATABASE hive;`命令来创建。 - 接着,你需要为用户“root”授予访问“hive”数据库的所有权限。可以使用以下两条命令,允许本地和远程访问: - `GRANT ALL PRIVILEGES ON *.* TO 'root'@'localhost' IDENTIFIED BY 'root';` - `GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root';` - 最后,使用`FLUSH PRIVILEGES;`命令使权限更改立即生效。 - 如果你使用的是MySQL 5.7,需要注意`password`字段已被替换为`authentication_string`,因此在查看用户权限时应使用相应的字段。 2. 下载并安装Hive - 访问Apache Hive的官方网站(https://hive.apache.org/)下载最新的Hive版本,这里是2.3.6。 - 下载完成后,解压Hive的安装包到你选择的目录,例如解压到`/sof/hive-2.3.6`。 3. 配置Hive - 编辑`/sof/hive-2.3.6/conf/hive-site.xml`文件,设置Hive的相关配置,包括Hadoop的路径、Hive元数据存储位置(指向MySQL的“hive”库)、Hive的 metastore_uri (指向MySQL的服务地址)等。 - 示例配置如下: ```xml <property> <name>hive.metastore.uris</name> <value>thrift://localhost:9083</value> </property> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>root</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>root</value> </property> ``` 4. 启动Hive服务 - 初始化Hive Metastore服务,执行`/sof/hive-2.3.6/bin/schematool -initSchema -dbType mysql`。 - 启动Hive Metastore服务,执行`/sof/hive-2.3.6/bin/hiveserver2`。 - 可以通过Hive CLI或Beeline客户端连接到Hive服务,验证安装是否成功。 以上步骤完成后,你将在Linux环境下成功部署了一个基于Hadoop和MySQL的Hive 2.3.6完全分布式实例。在实际操作过程中,确保所有依赖项都已正确配置,如Java环境、Hadoop配置等,以确保Hive的正常运行。同时,注意安全实践,避免使用过于简单的用户名和密码。