Hadoop伪分布环境下Hive安装与配置详解
需积分: 19 123 浏览量
更新于2024-09-12
收藏 135KB DOCX 举报
本文档主要介绍了如何在CentOS 6.4环境下进行Hadoop 2.2.0和Hive 0.12.0的伪分布式安装,以及处理可能遇到的错误和配置步骤。以下是详细的内容概要:
1. **环境与软件准备**:
- 操作系统:CentOS 6.4 x86_64
- Hadoop版本:2.2.0
- Hive版本:0.12.0
- 数据库:MySQL(默认版本5.1.66),后续需升级或配置
2. **MySQL管理**:
- 安装与卸载:检查已安装的MySQL,使用`yum remove`卸载旧版,然后重新安装`yum install`。
- 基本配置:设置MySQL开机自启动,首次使用时设置密码,必要时通过编辑`/etc/my.cnf`进行调整。
3. **Hive JDBC驱动**:
- 将MySQL JDBC驱动添加到Hive的lib目录,确保驱动与MySQL版本兼容(5.1的驱动支持4.1-6.0,推荐尽量匹配)。
4. **创建Hive数据库和设置编码**:
- 创建Hive数据库:`CREATE DATABASE hive;`
- 设置数据库字符集:`ALTER DATABASE hive CHARACTER SET latin1;`
5. **Hive权限设置**:
- 解压Hive安装包:`tar -zvxf hive-0.12.0.tar.gz`
- 修改目录名称:`mv hive-0.12.0 hive`
- 配置环境变量:编辑`hive-env.sh`,指定所有者为hadoop,并添加必要的配置。
- 复制配置文件:如`hive-default.xml`和`hive-site.xml`,确保所有者为hadoop。
6. **Hive-site.xml配置**:
- 添加数据库连接信息,包括主机名(如localhost)、数据库名、用户名(建议使用root)、以及MySQL登录密码。
7. **验证Hive安装**:
- 切换到Hadoop用户并检查Hadoop是否正常运行。
- 执行Hive:进入Hive目录并运行`./hive`,可能会有警告,可以忽略继续。
8. **使用Hive进行操作**:
- 使用Hive命令行工具进行数据处理和查询。
总结来说,本文提供了在CentOS 6.4上搭建Hadoop 2.2.0和Hive 0.12.0伪分布环境的详细步骤,包括MySQL的升级、配置和Hive的安装、配置以及连接数据库的操作。通过这些步骤,读者可以成功地在自己的环境中运行Hive,从而进行大数据分析。
2011-07-14 上传
2012-02-21 上传
2023-12-15 上传
2023-05-01 上传
2023-06-10 上传
2023-07-28 上传
2023-06-06 上传
2023-04-28 上传
2023-06-09 上传
2023-06-11 上传
ITboy-Bear
- 粉丝: 24
- 资源: 9
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦