Esri大数据平台Hive搭建详解与实战步骤

需积分: 0 196 浏览量更新于2024-08-04 收藏 3.08MB DOCX 举报

本文档是易智瑞中国信息技术有限公司于2017年3月发布的Esri大数据平台搭建指南的一部分，专注于Hive模块。Hive是一个基于Hadoop的数据仓库工具，它将结构化数据映射为数据库表，提供SQL查询支持，将SQL语句转化为MapReduce任务执行。Hive的核心特点在于其元数据管理，它使用RDBMS（如Derby、MySQL、Oracle或PostgreSQL，默认为Derby）存储元数据，且支持远程服务器模式通过Thrift协议访问。在搭建Hive环境前，先确保已经具备HDFS的基础，因为Hive依赖HDFS作为底层文件系统。Hive的搭建步骤包括： 1. 创建Hive安装路径（例如/var/hive）并传输Hive软件包（apache-hive-1.2.1-bin.tar.gz）至该目录，然后解压并重命名文件夹为hive。 2. 配置Hive环境变量，首先编辑`/etc/profile`文件，然后运行`source/etc/profile`使其生效。由于配置文件中的参数不易查找，建议先在本地使用文本编辑器（如Notepad++）搜索并修改参数，然后复制回CentOS服务器。 3. 复制两个关键配置文件：`hive-env.sh`用于环境变量设置，`hive-site.xml`用于Hive特定配置，比如数据库连接信息等。 4. 使用hadoop用户权限，启动Hive的元数据服务（Metastore Server）。这通常涉及在新终端窗口中运行相关命令。 5. 测试Hive的可用性，例如通过将地震分布数据（earthquakes.csv）上传到Hadoop目录（如/home/hadoop），然后在Hive中创建名为earthquakes的表，并可能涉及到将本地文件导入到这个表中。本文档详细介绍了如何在Esri大数据平台上搭建Hive，包括元数据库的配置、环境变量的设置、软件包的管理和数据的注册流程。这对于希望在Hadoop生态系统中进行数据仓库管理和分析的用户来说是一份实用的指南。

网址：www.esrichina.com.cn 技术支持网站：support.esrichina.com.cn 电话：010-57632288 技术支持热线：400-819-2881

Esri 大数据平台搭建指南之

Hive

易智瑞中国信息技术有限公司

2017 年 3 月

下载后可阅读完整内容，剩余9页未读，立即下载

王者丶君临天下

粉丝: 20
资源: 265

Esri大数据平台Hive搭建详解与实战步骤

Esri大数据平台搭建指南之HDFS1

Esri大数据平台搭建指南概述1

Esri大数据平台搭建指南之Ambari1

Ambari搭建指南：构建Esri大数据平台基石

Esri大数据平台HDFS搭建详解：从基础到实战

ESRI用户使用Python指南

影像大数据平台软件材料.docx

栅格影像大数据平台介绍及实例.pptx

ArcGIS对接人脸大数据平台接口V0.1.201705051

ESRI栅格影像大数据平台：ArcGISImageServer功能详解与实例

最新资源