Hive SQL操作指南：创建、修改与查询数据库表

4星 · 超过85%的资源需积分: 49 150 浏览量更新于2024-09-18 2 收藏 5KB TXT 举报

"HIVE-SQL操作语句涵盖了在Hadoop数据库中使用Hive进行数据管理的基本操作。Hive是一个基于Hadoop的数据仓库工具，它允许使用类SQL（HiveQL）语言来处理存储在Hadoop分布式文件系统(HDFS)中的大规模数据集。以下是Hive SQL操作的关键知识点： 1. 创建表： - `CREATE TABLE pokes(foo INT, bar STRING);` 这个命令用于创建一个名为`pokes`的非分区表，包含两个字段`foo`（整型）和`bar`（字符串型）。 - `CREATE TABLE invites(foo INT, bar STRING) PARTITIONED BY (ds STRING);` 创建一个分区表`invites`，除了`foo`和`bar`字段外，还有额外的分区字段`ds`（日期型）。 2. 查看表： - `SHOW TABLES;` 显示当前数据库的所有表名。 - `SHOW TABLES '.*s';` 使用通配符显示符合特定模式的表名。 3. 修改表结构： - `ALTER TABLE pokes ADD COLUMNS (new_col INT);` 在`pokes`表中添加一个新的整型字段`new_col`。 - `ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'acomment');` 在`invites`表中添加一个带有注释的新整型字段`new_col2`。 4. 重命名和删除表： - `ALTER TABLE events RENAME TO 3koobecaf;` 将`events`表重命名为`3koobecaf`。 - `DROP TABLE pokes;` 删除名为`pokes`的表，数据将永久丢失。 5. 加载数据： - `LOAD DATA LOCAL INPATH './examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;` 从本地文件系统加载数据到`pokes`表中，覆盖原有数据。 - `LOAD DATA LOCAL INPATH './examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION(ds='2008-08-15');` 加载数据到`invites`表的特定分区，覆盖原有数据。 - `LOAD DATA INPATH '/user/myname/kv2.txt' OVERWRITE INTO TABLE invites PARTITION(ds='2008-08-15');` 从HDFS加载数据，与上一条命令类似，但不涉及本地文件系统。 6. 查询数据： - `SELECT a.foo FROM invites a WHERE a.ds='<DATE>';` 从`invites`表中查询`ds`字段等于特定日期的`foo`值。 - `INSERT OVERWRITE DIRECTORY '/tmp/hdfs_out' SELECT a.* FROM invites a WHERE a.ds='<DATE>';` 将查询结果写入HDFS目录`/tmp/hdfs_out`。 - `INSERT OVERWRITE LOCAL DIRECTORY '/tmp'` 通常与`SELECT`语句结合使用，将查询结果写入本地文件系统。这些基本操作构成了Hive SQL的核心，使得数据分析师和开发人员可以方便地对大数据集进行存储、管理和分析，而无需深入了解底层的Hadoop生态系统。通过Hive，用户可以利用SQL的熟悉语法，处理海量数据，提高工作效率。

DDL Operations
创建表
hive> CREATE TABLE pokes (foo INT, bar STRING);
创建表并创建索引字段ds
hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING);
显示所有表
hive> SHOW TABLES;
按正条件（正则表达式）显示表，
hive> SHOW TABLES '.*s';
表添加一列
hive> ALTER TABLE pokes ADD COLUMNS (new_col INT);
添加一列并增加列字段注释
hive> ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'a comment');
更改表名
hive> ALTER TABLE events RENAME TO 3koobecaf;
删除列
hive> DROP TABLE pokes;
元数据存储
将文件中的数据加载到表中
hive> LOAD DATA LOCAL INPATH './examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;
加载本地数据，同时给定分区信息
hive> LOAD DATA LOCAL INPATH './examples/files/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');
加载DFS数据，同时给定分区信息
hive> LOAD DATA INPATH '/user/myname/kv2.txt' OVERWRITE INTO TABLE invites PARTITION (ds='2008-08-15');
The above command will load data from an HDFS file/directory to the table. Note that loading data from HDFS will result in moving the file/directory. As a result, the operation is almost instantaneous.
SQL 操作
按先件查询
hive> SELECT a.foo FROM invites a WHERE a.ds='<DATE>';
将查询数据输出至目录
hive> INSERT OVERWRITE DIRECTORY '/tmp/hdfs_out' SELECT a.* FROM invites a WHERE a.ds='<DATE>';

下载后可阅读完整内容，剩余4页未读，立即下载

liulong_0702

粉丝: 0
资源: 7

Hive SQL操作指南：创建、修改与查询数据库表

hive sql语句查询

Hive_0.12_API_EN.chm

HiveSQL详细和优化

电商业务表hive-sql建表语句

hive-sql语法大全

大数据hive数据倾斜，hive-sql优化

HIVE-SQL开发规范.zip

优化Hive-JDBC：SQL语句记录至MySQL数据库实现统计与优化

-e 直接调用hivesql语句 hive -e "select * from test.emp;" -f 调用文件中hivesql语句 vim hivef.sql select * from test.emp; hive -f /home/hadoop/123/hivef.sql > /home/hadoop/123/234/hivef.txt

-e 直接调用hivesql语句 hive -e "select * from test.emp;"，-f 调用文件中hivesql语句 vim hivef.sql select * from test.emp; hive -f /home/hadoop/123/hivef.sql > /home/hadoop/123/234/hivef.txt

最新资源