(1) 在Hive中创建数据库itcast_ods。 (2) 临时配置压缩生效。 (3) 在数据库itcast_ods创建源数据表web_chat_ems_ods,指定文件存储格式为ORC,压缩格式为ZLIB。
时间: 2024-02-25 18:54:16 浏览: 136
好的,你的要求我已经听清楚了。下面是针对你的问题的回答:
1. 在 Hive 中创建数据库 itcast_ods 的 SQL 语句如下:
```sql
CREATE DATABASE IF NOT EXISTS itcast_ods;
```
2. 临时配置压缩生效的 SQL 语句如下:
```sql
SET hive.exec.compress.output=true;
SET mapreduce.output.fileoutputformat.compress=true;
SET mapreduce.output.fileoutputformat.compress.type=BLOCK;
SET mapreduce.output.fileoutputformat.compress.codec=org.apache.hadoop.io.compress.SnappyCodec;
```
这里我使用了 Snappy 压缩算法,你可以根据自己的需求选择其他压缩算法。
3. 在数据库 itcast_ods 中创建源数据表 web_chat_ems_ods,指定文件存储格式为 ORC,压缩格式为 ZLIB 的 SQL 语句如下:
```sql
USE itcast_ods;
CREATE TABLE IF NOT EXISTS web_chat_ems_ods (
id INT,
message STRING,
send_time STRING,
sender_id INT,
receiver_id INT
)
STORED AS ORC
TBLPROPERTIES (
'orc.compress'='ZLIB'
);
```
这里我假设表中有五个字段,分别是 id、message、send_time、sender_id 和 receiver_id。如果实际情况不同,请根据需要修改 SQL 语句。
阅读全文