hive 创建外部表同时导入数据
时间: 2023-08-02 18:31:03 浏览: 105
(一)hive导入数据
好的,下面是Hive创建外部表同时导入数据的步骤:
1. 打开Hive命令行终端,输入以下命令以创建一个新的数据库:
```
CREATE DATABASE my_database;
```
2. 使用以下命令来选择创建的数据库:
```
USE my_database;
```
3. 输入以下命令创建一个新的外部表,例如我们创建一个名为`my_table`的外部表:
```
CREATE EXTERNAL TABLE my_table (
id INT,
name STRING,
age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LOCATION '/user/hive/data';
```
上述命令创建了一个外部表,其结构与前面创建的表相同,但是它的数据存储在`/user/hive/data`目录下,而不是Hive默认的目录中。
4. 接下来,使用以下命令将数据从文件中导入到新创建的外部表中,例如我们将数据文件存储在`/user/hive/data`目录下,并且文件名为`data.txt`:
```
LOAD DATA INPATH '/user/hive/data/data.txt' OVERWRITE INTO TABLE my_table;
```
上述命令将数据文件中的数据导入到名为`my_table`的外部表中,并将数据文件从`/user/hive/data`目录移动到Hive默认的目录中。
到这里,我们就完成了Hive创建外部表同时导入数据的过程。需要注意的是,外部表的数据存储在Hadoop集群中,并且Hive只是对这些数据的元数据进行管理,因此在删除外部表时,数据不会被删除。
阅读全文