Hive SQL语法详解：创建、修改与操作指南

需积分: 0 61 浏览量更新于2024-06-25 收藏 443KB PDF 举报

Hive SQL是一种用于大数据处理的SQL方言，主要应用于Apache Hadoop生态系统中，它扩展了标准SQL以适应大规模数据的处理需求。以下是关于Hive SQL语法的全面概述： 1. **数据库操作**: - `CREATE DATABASE IF NOT EXISTS db_name [LOCATION 'path'] [COMMENT database_comment];` 这条语句用于创建一个数据库，如果数据库已存在则不执行任何操作，`LOCATION`是可选的，指定数据库的存储位置，默认为HDFS的/user/hive/warehouse。`COMMENT`用于添加数据库注释，而`IF NOT EXISTS`确保只有当数据库不存在时才会创建。 - `DROP DATABASE [IF EXISTS] db_name [CASCADE];` 删除数据库，`IF EXISTS`选项使得在数据库存在时才执行删除操作。`CASCADE`参数表示如果数据库包含表，将强制删除所有关联的表，防止数据丢失。 2. **数据类型**: Hive支持多种数据类型，包括基础类型： - `BOOLEAN`: 逻辑值(true/false)。 - `TINYINT`: 单字节有符号整数，范围是-128到127。 - `SMALLINT`: 两个字节的有符号整数，范围是-32768到32767。 - `INT`: 四字节有符号整数。 - `BIGINT`: 八字节的有符号整数。 - `FLOAT`: 单精度浮点数，占用4字节。 3. **表操作**: - `ALTER DATABASE database_name SET LOCATION hdfs_path;` 这个命令允许改变数据库的存储位置，但请注意，这并不会移动已有的数据，而是更新新表的存储位置，原有表数据保持不变。 4. **查询语句**: - `SELECT expr, ... FROM tbl ORDER BY col_name [ASC|DESC];` 查询语句是Hive SQL的核心部分，`SELECT`后面可以跟多个查询表达式，用逗号分隔。`FROM`后面指定数据表，`ORDER BY`用于对结果进行排序，`ASC`表示升序，`DESC`表示降序。 5. **数据库选择**: 在Hive中，`USE`命令用于选择数据库，如果不使用该命令，默认在`default`库中执行SQL操作。若需切换数据库，可以使用`USE database_name;`。 6. **SQL选项**: - `[IF EXISTS]`和`[CASCADE]`选项分别用于控制对已有对象的操作是否执行，前者在数据库或表操作时提供安全的控制，后者在删除数据库时强制移除相关对象。 Hive SQL语法注重扩展性和大容量数据的处理，提供了丰富的数据类型和数据库管理功能，同时保持了SQL的基本查询结构。在实际应用中，理解并熟练掌握这些基本语法是进行大数据分析和处理的关键。

修改属性



分区操作

创建分区表



添加分区



修改分区值

注意

只会在元数据中修改，不会同步修改HDFS路径吗，如：

原分区路径为： /user/hive/warehouse/test.db/test_table/month=201910 ，分区名：

month='201910'

将分区名修改为： 201911 后，分区所在路径不变，依旧

是： /user/hive/warehouse/test.db/test_table/month=201910



如果希望修改分区名后，同步修改HDFS的路径，并保证正常可用，需要：

在元数据库中：找到SDS表 -> 找到LOCATION列 -> 找到对应分区的路径记录进行修改

如将记录的： /user/hive/warehouse/test.db/test_table/month=201910 修改

为： /user/hive/warehouse/test.db/test_table/month=201911

在HDFS中，同步修改文件夹名

ALTER TABLE tbl SET TBLPROPERTIES(key=value);

-- 常用属性

("EXTERNAL"="TRUE") -- 内外部表，TRUE表示外部表

('comment' = new_comment) -- 修改表注释

-- 其余属性参见

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDD

L-listTableProperties

-- 分区表示意

CREATE TABLE test_ext(id int) COMMENT 'partitioned table' PARTITION BY(year string,

month string, day string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

ALTER TABLE tablename ADD PARTITION (partition_key='partition_value', ......);

ALTER TABLE tablename PARTITION (partition_key='old_partition_value') RENAME TO

PARTITION (partition_key='new_partition_value');

剩余20页未读，继续阅读

你很棒滴

粉丝: 32

Hive SQL语法详解：创建、修改与操作指南

Hive-SQL语法大全

Hive_SQL语法大全

Hive SQL语法总结

11-Hive-SQL语法

Hive-SQL相关语法

HIVE-SQL操作语句

HIVE-SQL开发规范.docx

HIVE-SQL开发规范.zip

连接hive-使用sqldeveloper作为客户端.zip

hive sql语法大全

最新资源