hive sql建表语句
时间: 2024-11-01 17:07:51 浏览: 16
Hive SQL是一种基于Hadoop的数据仓库工具,用于处理大规模数据集。创建表(也叫数据存储)的基本语法结构如下:
```sql
CREATE [EXTERNAL] TABLE table_name
[PARTITIONED BY (partition_column1 data_type, partition_column2 data_type, ...)]
CLUSTERED BY (clustered_column1, clustered_column2, ...) INTO num_buckets BUCKETS
STORED AS [INPUT_FORMAT 'input_format_class']
OUTPUT_FORMAT 'output_format_class'
LOCATION 'path_to_table_location'
[TBLPROPERTIES ('property_name'='value', ...)];
```
这里解释一下关键部分:
1. `table_name`: 要创建的表的名称。
2. `EXTERNAL`: 如果不想复制数据,可以指定外部表,如果文件已经存在则不会再次加载。
3. `PARTITIONED BY`: 分区字段,有助于提高查询性能。
4. `CLUSTERED BY`: 主键或聚集列,对数据进行物理排序和分桶。
5. `num_buckets`: 指定分桶数。
6. `STORED AS`: 数据的输入和输出格式,如`TEXTFILE`, `SEQUENCEFILE`, 等等。
7. `LOCATION`: 表的实际存储位置。
8. `TBLPROPERTIES`: 可选的表属性。
阅读全文