hive 创建 parquet Bloom Filter表语句
时间: 2023-08-30 22:06:57 浏览: 224
Hive的数据模型-分区表语法-hive基础ppt
创建 Parquet Bloom Filter 表的语句如下:
```
CREATE TABLE IF NOT EXISTS table_name (
col1 data_type,
col2 data_type,
col3 data_type,
...
)
PARTITIONED BY (partition_col data_type)
STORED AS PARQUET
TBLPROPERTIES ("parquet.bloom.filter.columns"="col1,col2");
```
其中,`table_name` 为表名,`data_type` 为列的数据类型,`partition_col` 为分区列的名称。
`PARTITIONED BY` 用于指定分区列,`STORED AS PARQUET` 表示使用 Parquet 格式存储数据。
`TBLPROPERTIES` 中的 `"parquet.bloom.filter.columns"` 参数用于指定需要创建 Bloom Filter 的列,多个列名之间使用逗号分隔。
例如,创建一个名为 `my_table` 的 Parquet Bloom Filter 表,其中有 `id` 和 `name` 两列,并按照 `dt` 分区,可以使用以下语句:
```
CREATE TABLE IF NOT EXISTS my_table (
id INT,
name STRING
)
PARTITIONED BY (dt STRING)
STORED AS PARQUET
TBLPROPERTIES ("parquet.bloom.filter.columns"="id,name");
```
执行完毕后,即可创建一个支持 Bloom Filter 的 Parquet 表。
阅读全文