INSERT OVERWRITE TABLE dw_rpt_report60010105049 SELECT ( SELECT MAX(char3) FROM orsuser_kara.para_nationality WHERE char2 = dw.tran_country ) AS tran_country, col2, col3, ... FROM dw_rpt_report60010105049 dw WHERE EXISTS ( SELECT 1 FROM orsuser_kara.para_nationality WHERE char2 = dw.tran_country ) 不用子查询作字段的写法,换一种写法
时间: 2024-01-29 20:02:03 浏览: 131
可以使用 JOIN 实现类似的功能,以下是可能的写法:
```
INSERT OVERWRITE TABLE dw_rpt_report60010105049
SELECT
COALESCE(n.char3, dw.tran_country) AS tran_country,
dw.col2,
dw.col3,
...
FROM dw_rpt_report60010105049 dw
LEFT JOIN orsuser_kara.para_nationality n
ON dw.tran_country = n.char2
WHERE n.char2 IS NOT NULL
```
这里使用了 LEFT JOIN,将原表和 `orsuser_kara.para_nationality` 表进行 JOIN 操作。在 JOIN 操作中,使用 `COALESCE` 函数将 `orsuser_kara.para_nationality` 表中的 `char3` 字段和原表中的 `tran_country` 字段合并成一个字段。如果 `orsuser_kara.para_nationality` 表中不存在与原表中的 `tran_country` 字段匹配的值,则 `COALESCE` 函数会返回原表中的 `tran_country` 字段。最后使用 WHERE 子句过滤掉没有匹配的记录。
相关问题
INSERT OVERWRITE TABLE dw_rpt_report60010105049 SELECT COALESCE(n.char3, dw.tran_country) AS tran_country, dw.col2, dw.col3, ... FROM dw_rpt_report60010105049 dw LEFT JOIN ( SELECT char2, MAX(char3) AS char3 FROM orsuser_kara.para_nationality GROUP BY char2 ) n ON dw.tran_country = n.char2 WHERE n.char2 IS NOT NULL 此段代码中的主表的tran_country不是唯一的,可能会导致发散,怎么优化
可以考虑使用子查询或者临时表的方式,先将主表的tran_country进行去重,再进行JOIN操作。具体实现方式如下:
使用子查询:
```
INSERT OVERWRITE TABLE dw_rpt_report60010105049
SELECT COALESCE(n.char3, t.tran_country) AS tran_country, t.col2, t.col3, ...
FROM (
SELECT DISTINCT tran_country, col2, col3, ...
FROM dw_rpt_report60010105049
) t
LEFT JOIN (
SELECT char2, MAX(char3) AS char3
FROM orsuser_kara.para_nationality
GROUP BY char2
) n ON t.tran_country = n.char2
WHERE n.char2 IS NOT NULL
```
使用临时表:
```
CREATE TEMPORARY TABLE temp_table AS
SELECT DISTINCT tran_country, col2, col3, ...
FROM dw_rpt_report60010105049;
INSERT OVERWRITE TABLE dw_rpt_report60010105049
SELECT COALESCE(n.char3, t.tran_country) AS tran_country, t.col2, t.col3, ...
FROM temp_table t
LEFT JOIN (
SELECT char2, MAX(char3) AS char3
FROM orsuser_kara.para_nationality
GROUP BY char2
) n ON t.tran_country = n.char2
WHERE n.char2 IS NOT NULL;
DROP TEMPORARY TABLE temp_table;
```
无论使用哪种方式,在进行JOIN操作之前,都先对主表进行去重,这样可以避免发散的情况发生,提高查询效率。
update dw_rpt_report60010105049 dw set dw.tran_country =(select max(b.char3)from orsuser_kara.para_nationality b where b.char2 = dw.tran_country)where exists(select 1from orsuser_kara.para_nationality p where p.char2=dw.tran_country) 改写成hive 写法
在 Hive 中,可以使用类似以下的语句来实现上述 SQL 语句的功能:
```
UPDATE dw_rpt_report60010105049
SET tran_country = (
SELECT MAX(char3)
FROM orsuser_kara.para_nationality
WHERE char2 = dw_rpt_report60010105049.tran_country
)
WHERE EXISTS (
SELECT 1
FROM orsuser_kara.para_nationality
WHERE char2 = dw_rpt_report60010105049.tran_country
)
```
需要注意的是,在 Hive 中不支持直接使用 UPDATE 语句更新表中的数据,需要使用 INSERT OVERWRITE 语句将更新后的数据重新写入目标表中,类似以下的方式:
```
INSERT OVERWRITE TABLE dw_rpt_report60010105049
SELECT
(
SELECT MAX(char3)
FROM orsuser_kara.para_nationality
WHERE char2 = dw.tran_country
) AS tran_country,
col2,
col3,
...
FROM dw_rpt_report60010105049 dw
WHERE EXISTS (
SELECT 1
FROM orsuser_kara.para_nationality
WHERE char2 = dw.tran_country
)
```
其中 `col2`, `col3`, ... 代表需要保留的其他列名。
阅读全文