Hive入门教程：使用putty连接与基本查询

需积分: 9 87 浏览量更新于2024-09-15 收藏 454KB DOCX 举报

"这篇文档是关于Hive的简易操作入门指南，主要针对使用putty通过SSH连接到Hive服务器进行HQL查询的流程。文中提到的Hive版本为0.9.0，强调不同版本的Hive可能在功能和支持上有所差异。教程包括安装SSH客户端Putty，连接到Hive服务器，登录Linux系统，以及进入Hive的shell环境执行查询语句。此外，还介绍了Hive的一些基本概念和命令行参数，包括Hive的交互模式和批处理模式。" Hive是一个基于Hadoop的数据仓库工具，它可以将结构化的数据文件映射为一张数据库表，并提供SQL-like查询语言HQL（Hive Query Language）来查询这些数据。在本文档中，Hive的入门步骤被详细地讲解，首先需要一个SSH客户端，如putty，用于远程连接到运行Hive服务的Linux服务器。putty是一款广泛使用的免费SSH客户端，它允许用户通过终端界面与远程服务器交互。在安装并运行putty之后，用户需要输入服务器的IP地址（192.168.83.96）和非默认的SSH端口号（1022），然后使用指定的用户名（如ppj）和密码（如HgeeGxR5）进行登录。一旦登录成功，用户就会进入Linux的bash shell，这里可以执行命令行指令。在Linux环境中，通过输入“hive”命令，用户可以进入Hive的shell环境。在这里，可以编写HQL语句进行数据查询。文档中给出了一个简单的查询示例：“Use test_wqd; Select * from pageview limit 5;”。值得注意的是，Hive语句以分号结束，这一点与SQL Server的T-SQL不同。 Hive提供了两种工作模式：交互模式和批处理模式。在交互模式下，用户可以直接在shell中输入HQL并立即看到结果。而批处理模式则适用于执行存储在文件中的多条命令，通过-f参数指定文件路径，例如：“hive -f query_script.hql”。 Hive的命令行参数扩展了其功能，如使用-e参数执行查询字符串，-f参数执行文件中的命令，-H或--help获取帮助信息，-S或--silent则开启安静模式，隐藏提示信息。这些参数使得Hive的使用更加灵活，适应不同的需求场景。这篇文档为初学者提供了Hive的基本操作指导，涵盖了从安装SSH客户端到执行HQL查询的全过程，同时也提醒用户注意不同Hive版本间的功能差异，为后续深入学习和使用Hive奠定了基础。

xyzxht

粉丝: 0
资源: 1

Hive入门教程：使用putty连接与基本查询

－－－Putty使用指南－－－

Hive简易操作入门中文最新版本

Hive查询优化整理与Hive简易版思维导图

HDFS+MapReduce+Hive十分钟快速入门

hive初始入门

Apache Hive教程：入门到精通

精通Hive编程：入门与实践指南

Hive开发入门与实战操作详解

Hive 101：入门指南与基本概念

Hive查询语句入门：SELECT基础语法解析

最新资源