Hive基础全面解析：服务、变量与操作详解

需积分: 50 161 浏览量更新于2024-07-18 15 收藏 639KB PDF 举报

Hive基础知识总结涵盖了Hive服务的核心组成部分，这些服务对于理解和使用Hive这个数据仓库工具至关重要。首先，Hive提供了多种服务供用户在不同场景下操作： 1) **Hive Shell (Cli)**: Hive的主要交互界面，是通过命令行接口实现的。用户可以通过`hive --service cli`命令启动Shell，执行SQL查询或管理任务。它支持变量替换 (`--define` 或 `--hivevar`)、指定数据库 (`--database`)、运行初始化脚本 (`-i`)、设置交互模式 (`-S`或`-v`)以及查看帮助信息 (`--help`）。默认情况下，不带参数就表示使用Hive Shell。 2) **Hive Server**: 这是Hive的核心服务，通过Thrift接口提供服务。Thrift是一种跨语言的通信协议，允许客户端（如Impala、Python、Java应用等）与Hive Server进行高效的数据处理和查询。Hive Server允许分布式处理，是大数据集群中的关键组件。 3) **Hive Web Interface (Hwi)**: Hwi是Hive的图形化用户界面，方便用户通过浏览器进行操作。使用前需确保安装了Ant并配置环境变量，然后通过`Hive --service hwi`启动服务，通过`localhost:9999/hwi`访问。在Web界面中，用户可以直观地查看数据、创建和管理表，以及执行更复杂的查询。此外，文档还提到了变量和属性的使用，这些在编写和执行Hive SQL语句时非常重要，能够简化脚本和提高可重复性。变量可以通过`--define`或`--hivevar`选项设置，而`--hiveconf`则用于设置Hive运行时的全局配置。日志管理也是基础部分，对Hive的性能监控和问题排查有很大帮助，尽管具体内容没有在这部分详细展开。掌握这些Hive基础知识对于开发人员、数据分析师或数据工程师来说是至关重要的，它们不仅涉及到Hive本身的使用，还包括如何与Hadoop生态系统中的其他组件（如HDFS、MapReduce）协同工作，以及如何优化查询性能和维护大规模数据仓库。理解并熟练运用这些知识，能够更有效地管理和分析存储在Hive中的海量数据。

hive> CREATE TABLE toss1(i int, ${hivevar:foo} string);

Time taken: 1.94 seconds

hive> DESCRIBE toss1;

i int

bar2 string

Time taken: 0.356 seconds, Fetched: 2 row(s)

hive> CREATE TABLE toss2(i2 int, ${foo} string);

Time taken: 0.285 seconds

hive> DESCRIBE toss2;

i2 int

bar2 string

Time taken: 0.05 seconds, Fetched: 2 row(s)

hive> DROP TABLE toss1;

Time taken: 0.817 seconds

hive> DROP TABLE toss2;

Time taken: 0.162 seconds

我们来看看–hiveconf 选项，其用于配置 Hive 行为的所有属性。我们用它来指定

hive.cli.print.current.db 属性。开启这个属性可以在 CLI 提示符前打印出当前所在的数据库

名，默认的数据库名为 default。这个属性的默认值是 false。

[hadoop@localhost hive]$ hive --hiveconf

hive.cli.print.current.db=true;

hive (default)> set hive.cli.print.current.db;

hive.cli.print.current.db=true

hive (default)> set hiveconf:hive.cli.print.current.db;

hiveconf:hive.cli.print.current.db=true

hive (default)> set hiveconf:hive.cli.print.current.db=false;

hive> set hiveconf:hive.cli.print.current.db=true;

hive (default)>

我们甚至可以增加新的 hiveconf 属性：

[hadoop@localhost hive]$ hive --hiveconf y=5;

剩余16页未读，继续阅读

一个打码的小年轻

粉丝: 7366
资源: 2

Hive基础全面解析：服务、变量与操作详解

hive调优总结文档-hive tuning ppt

大数据面试 Hive 八股文

hive 语句总结

24年某马最新树状Hive知识点总结

hadoop-hive的知识点总结

hive开窗函数知识点总结.txt

Hive知识图谱.xmind

hive参数优化总结

hive语法总结

大数据hadoop，spark，hive等等面试汇总

最新资源