HIVE常用操作与函数：数据库、数据表、表信息、数据导入、关系和数学运算。

需积分: 0 52 浏览量更新于2024-01-02 收藏 567KB PDF 举报

HIVE是一种基于Hadoop的大数据处理工具，它提供了类似于SQL的查询语言，可以对存储在Hadoop集群中的大规模数据进行操作和分析。在HIVE常用操作中，有一些常用函数和关系运算可以帮助我们更方便地处理和分析数据。首先，我们可以通过以下几个步骤来使用HIVE进行常用操作。首先，我们可以使用命令来查看数据库列表和数据表列表，以便了解我们当前所拥有的数据库和数据表的情况。其次，我们可以使用HIVE提供的CREATE TABLE语句来创建新的数据表，可以自定义表名和字段名，并指定字段的数据类型。然后，我们可以使用DESCRIBE命令来查看表的详细信息，包括表的结构、字段和分区等信息。接下来，我们可以使用LOAD DATA语句将数据导入到数据表中，可以从本地文件系统或者Hadoop集群中的其他数据表中导入数据。此外，我们还可以使用JOIN语句进行连接查询，可以连接多个数据表，并根据指定的条件进行数据的关联查询。另外，我们可以使用ORDER BY语句对查询结果进行排序操作，以便按照指定的字段进行升序或降序排列。同时，我们还可以使用GROUP BY语句对查询结果进行分组操作，并可以结合使用聚合函数，如SUM、COUNT、AVG等来对分组后的数据进行统计分析。此外，HIVE还支持HASH操作，可以对数据进行散列分区，以提高查询效率，减少数据倾斜。在HIVE常用操作中，还有一些常用的关系运算可以帮助我们进行条件筛选和数据过滤。首先，我们可以使用等值比较（=）进行字段的相等判断，可以根据指定的条件进行数据的筛选。其次，我们可以使用不等值比较（<>）进行字段的不相等判断，可以选取与指定条件不匹配的数据。此外，我们还可以使用小于（等于）比较（<=）和大于（等于）比较（>=）进行字段的大小判断，根据指定的条件选取符合要求的数据。此外，我们还可以使用空值判断来判断字段是否为空，可以给予不同的处理逻辑。同时，HIVE还支持LIKE比较，可以使用通配符进行模糊匹配，以获取符合特定模式的数据。另外，HIVE还支持正则匹配（RLIKE），可以使用正则表达式对字段进行匹配操作，以筛选满足条件的数据。在HIVE常用操作中，还包括了一些数学运算的操作，可以帮助我们对字段进行数值计算和操作。首先，四则运算可以帮助我们进行加、减、乘、除等基本数学运算，可以对数值字段进行加减乘除的操作。其次，取余运算（%）可以帮助我们求得两个数相除的余数。此外，按位与运算（&）可以帮助我们对两个二进制数进行位运算，以得到与运算的结果。综上所述，通过HIVE常用操作中的常用函数和关系运算，我们可以对存储在Hadoop集群中的大规模数据进行操作和分析，提取出我们所需要的数据，满足数据处理和分析的需求。同时，通过数学运算的支持，可以在数据操作中进行更为复杂的数值计算和运算操作。因此，熟练掌握HIVE常用操作中的常用函数和关系运算，对于进行大数据处理和分析具有重要的意义。

分区表创建

从查询结果创建

默认分隔符为’\001’

4. 查看表信息

查看表结构

查看分区信息

5. 数据导入

文件导入

create external table {tableName}(

{columnName} {columnType},

{columnName} {columnType}

)

[row format delimited fields terminated by '\t' location

'{HDFS_path}'];

create [external] table {tableName}(

{columnName} {columnType},

{columnName} {columnType}

)

partitioned by(

{columnName} {columnType},

{columnName} {columnType}

)

[row format delimited fields terminated by '\t' location

'{HDFS_path}'];

create table {tableName} as {selectSql}; 1.

desc {tableName};

{desc formatted}/{describe} {tableName};

show partitions {tableName}; 1.

剩余15页未读，继续阅读

小小二-yan

粉丝: 33
资源: 299

HIVE常用操作与函数：数据库、数据表、表信息、数据导入、关系和数学运算。

Hive常用参数配置与调优指南

Hive动态分区与性能优化参数详解

精通Hive：Hadoop数据仓库系统实战指南

Hive函数大全.pdf

《Hive数据仓库案例教程》教学大纲.pdf

第十二节、sqoop的安装与使用.pdf1

CLOUDERA-Manager_中文手册.pdf

05-大数据技术之面试题复习1.6.pdf

【63课时完整版】大数据实践HIVE详解及实战

Hive动态分区加载与数据操作详解

最新资源