Hive分区表详解：静态与动态分区的建表与操作实例

需积分: 49 43 浏览量更新于2024-09-07 1 收藏 10KB TXT 举报

“这篇教程详细介绍了Hive中的分桶表和分区表的概念，以及如何使用建表语句创建这些表。内容涵盖了从一级静态分区到二级静态分区，再到一级和二级动态分区的创建方法，同时也讲解了如何对分区进行查询、删除、添加以及数据的导入。” 在Hive中，分区表是一种优化数据存储和查询效率的重要手段。通过分区，我们可以将大规模的数据按照特定的字段（通常是日期、地区等）划分为多个小块，从而在查询时减少处理的数据量，提高查询速度。 1. 静态分区表：静态分区表是指在创建表时就预定义了分区列及其值。例如，一级静态分区表创建语句如下： ```sql CREATE TABLE my_partitioner1 ( id BIGINT, name STRING, time DATE, love VARCHAR(50)) PARTITIONED BY (sex STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; ``` 在这个例子中，`sex`就是分区列，我们可以在插入数据时指定具体的分区值。对于二级静态分区表，例如： ```sql CREATE TABLE my_partitioner3 ( id BIGINT, name STRING, time DATE, interest ARRAY<STRING>) PARTITIONED BY (sex STRING, country STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY ','; ``` 这里除了`sex`之外，还增加了`country`作为分区列。 2. 数据加载：加载数据到静态分区表通常有两种方式：一是通过`LOAD DATA [LOCAL] INPATH`命令，二是通过`INSERT INTO`语句配合子查询。 - 使用`LOAD DATA`命令，如： ```sql LOAD DATA [LOCAL] INPATH '/root/my_partitioner3.txt' INTO TABLE my_partitioner4 PARTITION(sex='woman', country='usa'); ``` - 使用`INSERT INTO`语句，需要指定分区，例如： ```sql INSERT INTO TABLE my_partitioner5 PARTITION(sex='man', country='china') SELECT * FROM some_other_table; ``` 3. 动态分区：动态分区允许在插入数据时动态地确定分区值，这在处理大量数据时非常有用。创建动态分区表的基本语法与静态分区类似，但在插入数据时，部分或全部分区列可以不指定具体值，而是使用`PARTITION()`关键字后面跟一个表达式。 4. 查询、删除和添加分区：查询分区数据可以使用`WHERE`子句指定分区条件，如`SELECT * FROM my_partitioner WHERE sex='man'`。删除分区使用`DROP PARTITION`语句，添加新的分区数据则可以通过`ALTER TABLE ADD PARTITION`命令。 Hive的分区表功能是大数据处理中的重要工具，通过合理设计和使用分区，可以极大地提升数据分析的效率和管理的便利性。理解并掌握分区表的创建、数据加载和查询操作，对于高效利用Hive进行大数据分析至关重要。

=======================================================================================================================================================
静态分区表
=======================================================================================================================================================

一级分区的静态分区表
create table my_partitioner1(
id bigint,
name string,
time date,
love varchar(50))
partitioned by(sex string)
row format delimited fields terminated by '\t'

二级分区的静态分区表
create table my_partitioner3(
id bigint,
name string,
time date,
interest array<string>)
partitioned by(sex string,country string)
row format delimited fields terminated by '\t'
collection items terminated by ','

分区数据

1 wd 2018-10-25 睡觉
2 zam 2018-10-26 吃
3 dong 2018-10-25 玩游戏

1 zam 2018-10-25 睡觉,吃，玩游戏

剩余8页未读，继续阅读

大耳朵丶猴

粉丝: 1
资源: 1

Hive分区表详解：静态与动态分区的建表与操作实例

hive sql语句查询

修改hive表分区名称

sql同步自动生成hive建表语句及注释

Mysql元数据如何生成Hive建表语句注释脚本详解

Hive建表语句详解与DDL编译过程

Apache Hive：Hadoop数据仓库详解与建表策略

hivesql建表语句

hive sql 建表语句

HIVE-分桶表的详解和创建实例.docx

Hive语法详解

最新资源