Hive入门教程:使用putty连接与基本查询

需积分: 9 2 下载量 87 浏览量 更新于2024-09-15 收藏 454KB DOCX 举报
"这篇文档是关于Hive的简易操作入门指南,主要针对使用putty通过SSH连接到Hive服务器进行HQL查询的流程。文中提到的Hive版本为0.9.0,强调不同版本的Hive可能在功能和支持上有所差异。教程包括安装SSH客户端Putty,连接到Hive服务器,登录Linux系统,以及进入Hive的shell环境执行查询语句。此外,还介绍了Hive的一些基本概念和命令行参数,包括Hive的交互模式和批处理模式。" Hive是一个基于Hadoop的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供SQL-like查询语言HQL(Hive Query Language)来查询这些数据。在本文档中,Hive的入门步骤被详细地讲解,首先需要一个SSH客户端,如putty,用于远程连接到运行Hive服务的Linux服务器。putty是一款广泛使用的免费SSH客户端,它允许用户通过终端界面与远程服务器交互。 在安装并运行putty之后,用户需要输入服务器的IP地址(192.168.83.96)和非默认的SSH端口号(1022),然后使用指定的用户名(如ppj)和密码(如HgeeGxR5)进行登录。一旦登录成功,用户就会进入Linux的bash shell,这里可以执行命令行指令。 在Linux环境中,通过输入“hive”命令,用户可以进入Hive的shell环境。在这里,可以编写HQL语句进行数据查询。文档中给出了一个简单的查询示例:“Use test_wqd; Select * from pageview limit 5;”。值得注意的是,Hive语句以分号结束,这一点与SQL Server的T-SQL不同。 Hive提供了两种工作模式:交互模式和批处理模式。在交互模式下,用户可以直接在shell中输入HQL并立即看到结果。而批处理模式则适用于执行存储在文件中的多条命令,通过-f参数指定文件路径,例如:“hive -f query_script.hql”。 Hive的命令行参数扩展了其功能,如使用-e参数执行查询字符串,-f参数执行文件中的命令,-H或--help获取帮助信息,-S或--silent则开启安静模式,隐藏提示信息。这些参数使得Hive的使用更加灵活,适应不同的需求场景。 这篇文档为初学者提供了Hive的基本操作指导,涵盖了从安装SSH客户端到执行HQL查询的全过程,同时也提醒用户注意不同Hive版本间的功能差异,为后续深入学习和使用Hive奠定了基础。