Hive表DDL操作(一)
时间: 2024-09-28 16:05:05 浏览: 29
Hive是一种基于Hadoop的数据仓库工具,它允许用户通过SQL查询处理大规模数据集。在创建Hive表之前,你需要了解一些基本的DDL(Data Definition Language,数据定义语言)操作。以下是创建Hive表的一些基本步骤:
1. **创建外部表(EXTERNAL TABLE)**:
```sql
CREATE EXTERNAL TABLE table_name (
column_1 data_type,
column_2 data_type,
...
)
PARTITIONED BY (partition_column data_type)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
LOCATION 'path_to_data';
```
`table_name`是你自定义的表名,`column_1`, `column_2`等代表列名和对应的数据类型。
2. **创建内部表(INNER TABLE)**:
```sql
CREATE TABLE table_name ...
WITH ('transient_lastDdlTime'='1458076509')
```
3. **分区表(PARTITIONED TABLE)**:
如果数据按某个属性分隔存储,可以创建分区表:
```sql
CREATE TABLE table_name ...
PARTITIONED BY (date_column date, year_column int);
```
4. **加载数据(LOAD DATA INPATH)**:
```sql
LOAD DATA LOCAL INPATH '/path/to/data/file.txt' INTO TABLE table_name;
```
5. **查看表结构(DESCRIBE)**:
```sql
DESCRIBE EXTENDED table_name;
```