"Hive基本命令操作及实际操作总结"

需积分: 0 192 浏览量更新于2024-01-13 3 收藏 569KB PDF 举报

Hive是一种基于Hadoop的数据仓库基础设施，它提供了一种类SQL的查询语言HQL(Hive Query Language)来方便用户查询和分析数据。在使用Hive进行数据操作时，我们需要掌握一些基本的命令操作。一、创建分区表语法在Hive中，我们可以创建分区表来更好地组织和管理数据。分区表是根据某一列的值进行数据分区，这样可以提高查询效率。二、创建二级分区表除了创建一级分区表，Hive还支持创建二级分区表。二级分区表是在一级分区表的基础上再进行分区，这样可以更加细致地管理数据。三、正常的加载数据在Hive中，我们可以使用LOAD命令来加载数据到表中。可以直接将数据文件加载到表中，也可以使用其他的数据源加载数据。四、查询数据在Hive中，我们可以使用SELECT语句来查询数据。通过编写HQL语句，可以方便地对数据进行过滤和聚合操作，从而得到我们需要的结果。五、Hive基本操作在实际使用Hive时，我们需要掌握一些基本的操作。 1. 启动Hive：使用bin/hive命令来启动Hive服务。 2. 查看数据库：使用"show databases;"命令可以查看当前Hive中存在的数据库。 3. 打开默认数据库：使用"use default;"命令可以打开默认数据库，默认数据库是Hive中的一个概念，它是Hive中表和数据的存放位置。 4. 显示数据库中的表：使用"show tables;"命令可以显示当前打开数据库中存在的表。 5. 创建一张表：使用"create table"命令可以在当前打开的数据库中创建表，需要指定表的名称和列的信息。 6. 查看表的结构：使用"desc"命令可以查看表的结构，即表的列名和列的类型。 7. 向表中插入数据：使用"insert into"命令可以向表中插入数据，需要指定要插入的列和对应的值。 8. 查询表中数据：使用"select * from"命令可以查询表中的数据，"*"表示查询所有的列。 9. 退出Hive：使用"quit;"命令可以退出当前的Hive服务。总结起来，使用Hive进行数据操作需要掌握创建分区表、创建二级分区表、加载数据、查询数据等基本操作。此外，还需要了解Hive的基本命令操作，包括启动Hive服务、查看数据库、创建表、查看表结构、插入数据、查询数据和退出Hive等操作。通过掌握这些操作，可以更好地使用Hive进行数据查询和分析。

分区表注意事项

修改表

重命名表

增加、修改和删除表分区

增加**/修改/替换列信息**

hive (default)> select * from dept_partition where month='201709';

(2)多分区联合查询

hive (default)> select * from dept_partition where month='201709'

union select * from dept_partition where month='201708'

union select * from dept_partition where month='201707';

4．增加分区

(1).创建单个分区

hive (default)> alter table dept_partition add partition(month='201706') ;

(2).同时创建多个分区

hive (default)> alter table dept_partition add partition(month='201705')    

   partition(month='201704');

5．删除分区

(1).删除单个分区

hive (default)> alter table dept_partition drop partition (month='201704');

(2).同时删除多个分区

hive (default)> alter table dept_partition drop partition (month='201705'),

partition (month='201706');

6．查看分区表有多少分区

hive> show partitions dept_partition;

7．查看分区表结构

hive> desc formatted dept_partition;

1.创建二级分区表

hive (default)> create table dept_partition2(

deptno int, dname string, loc string)

partitioned by (month string, day string)

row format delimited fields terminated by '\t';

2.正常的加载数据

（1）加载数据到二级分区表中 hive (default)> load data local inpath

'/opt/module/datas/dept.txt' into table

default.dept_partition2 partition(month='201709', day='13');

（2）查询分区数据

hive (default)> select * from dept_partition2 where month='201709' and day='13';

3.查询数据

select * from dept_partition2 where month='201709' and day='10';

1．语法

alter table table_name rename to new_table_name

2．实操案例

hive (default)> alter table dept_partition2 rename to

dept_partition3;

详见 4.6.1 分区表基本操作。

剩余16页未读，继续阅读

莫少儒

粉丝: 31
资源: 311

"Hive基本命令操作及实际操作总结"

hive基本操作

Hive基本操作命令大全

hive操作命令

13-Hive基本操作1

hive常用命令

hive常用命令+日常

Java私塾：Hive Shell 基本操作——深入浅出学Hive

HBase与Hive操作命令详解

Hive操作命令全解析与实战指南

Hive数据库基本操作优化及实验目的总结

最新资源