CentOS7安装MySQL5.7与Hive2.1：元数据存储配置 - CSDN文库

需积分: 12 147 浏览量更新于2024-08-09 收藏 213KB PDF 举报

"Hive数据库的安装及基本使用" 在大数据处理领域，Apache Hive是一个非常重要的组件，它提供了一个SQL-like接口来查询存储在Hadoop分布式文件系统(HDFS)中的大量数据。Hive的设计目标是让熟悉SQL的用户能够轻松地进行数据分析，而无需深入学习MapReduce或其他低级分布式计算框架。在本教程中，我们将讨论如何在基于Hadoop的环境上安装Hive以及依赖的MySQL。首先，我们来了解如何在CentOS7上安装MySQL5.7： 1. 使用`wget`命令下载MySQL的源安装包。 2. 安装源包。 3. 检查MySQL源的安装情况。 4. 修改源文件以选择特定版本（例如，从5.7切换到5.6）。 5. 使用`yum install`命令安装MySQL社区服务器。 6. 启动MySQL服务并确认其运行状态。 7. 设置MySQL的初始密码。 8. 登录MySQL并更改密码策略。 9. 配置MySQL允许远程访问。安装MySQL是必要的，因为Hive默认使用内嵌的Derby数据库存储元数据，但Derby仅支持单个会话，不适合多用户环境。使用MySQL作为元数据库可以支持多个用户并发操作，而且Hive与MySQL有良好的兼容性。接下来，我们转向Hive2.1的安装步骤： 1. 熟悉Hive的基本概念，它是建立在Hadoop之上，提供SQL查询接口用于大数据分析。 2. 安装MySQL是为了提供稳定的元数据存储，确保多用户环境下Hive的正常运作。 3. 在MySQL安装完成后，确保MySQL服务启动并设置为开机启动。 4. 创建Hive所需的数据库和用户，这将用于存储Hive的元数据。 5. 下载并配置Hive的安装包，通常包括解压、设置环境变量等步骤。 6. 初始化Hive metastore，将元数据加载到MySQL中。 7. 启动Hive服务，如Hiveserver2，以便通过Beeline或JDBC客户端进行交互。在安装Hive的过程中，你可能还需要配置Hadoop的相关参数，例如Hive的配置文件`hive-site.xml`中需要添加MySQL的连接信息，包括数据库地址、用户名、密码等。此外，为了优化性能，可能还需要调整Hive的内存分配、并行度等参数。在Hive的基本使用中，你可以通过Hive shell或Beeline客户端执行SQL查询。例如，创建表、导入数据、执行SELECT查询、JOIN操作、聚合函数等。Hive还支持分区和桶，这些特性可以帮助优化查询性能和管理大规模数据。安装和配置Hive以及依赖的MySQL是大数据环境中进行高效数据处理的重要步骤。通过这个过程，你可以为数据分析师和数据科学家提供一个友好的SQL接口，让他们能够专注于数据分析，而不是底层的分布式计算细节。

Hive

一、CentOS7安装MySql5.7

1、安装wget



2、下载mysql源安装包

3、安装mysql源

4、检查mysql源是否安装成功

5、修改源文件(其实可以不执行，默认安装5.7)

改变默认安装的mysql版本。比如要安装5.6版本，将5.7源的enabled=1改成enabled=0。然后再将5.6

源的enabled=0改成enabled=1即可。

6、安装

7、启动MySql

yum install wget

Is this ok[y/d/N]:y

是否继续？[y/N]:y

wget http://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm

yum localinstall mysql57-community-release-el7-8.noarch.rpm

Is this ok[y/d/N]:y

yum repolist enabled | grep "mysql.*-community.*"      --控制台显示信息

vi /etc/yum.repos.d/mysql-community.repo

yum install mysql-community-server

Is this ok[y/d/N]:y

是否继续？[y/N]:y

下载后可阅读完整内容，剩余4页未读，立即下载

wsrxiaochou

粉丝: 0
资源: 5

最新资源