CREATE TABLE IF NOT EXISTS CDBILSDBA.T_SUBJECT_TEMPLATE_CONFIG

这是一条 SQL 语句，用于在 CDBILSDBA 数据库中创建 T_SUBJECT_TEMPLATE_CONFIG 表。如果该表已经存在，则不执行创建操作。该表可能用于存储课题模板的配置信息。需要根据实际需求定义表的结构和约束条件，以确保数据的完整性和一致性。例如，可以使用 CREATE TABLE 语句定义列名、数据类型、主键、外键、唯一性约束等。

set hive.exec.dynamic.partition.mode=nonstrict; set hive.exec.parallel=true; set hive.exec.parallel.thread.number=30; --drop table if exists dm_finrisk.dm_event_walletSettleSuccessEvent_di; create table if not exists dm_finrisk.dm_event_cashLoanEvent_di( event_uuid string ,event_code string ,dt string ,event_time string ,rawSnapshot string ) COMMENT 'cashLoanEvent' PARTITIONED BY ( day bigint)stored as parquet; drop table if exists tmp.tmp_dm_event_cashLoanEvent_di_01_${zdt.addDay(-1).format("yyyyMMdd")}; create table if not exists tmp.tmp_dm_event_cashLoanEvent_di_01_${zdt.addDay(-1).format("yyyyMMdd")} as select uuid as event_uuid ,event as event_code ,from_unixtime(unix_timestamp(cast(day as string),'yyyymmdd'),'yyyy-mm-dd') as dt ,from_unixtime(cast(cast(`time` AS BIGINT)/1000 AS BIGINT),'yyyy-MM-dd HH:mm:ss') as event_time ,get_json_object(data,'$.hotPublish.rawSnapshot') as rawSnapshot from dm_finrisk.ods_event_hdfs_snapshot_di where code = 'shield@cashLoanEvent' and day=${zdt.addDay(-1).format("yyyyMMdd")} drop table if exists tmp.tmp_dm_event_cashLoanEvent_di_02_${zdt.addDay(-1).format("yyyyMMdd")}; create table if not exists tmp.tmp_dm_event_cashLoanEvent_di_02_${zdt.addDay(-1).format("yyyyMMdd")} as select event_uuid ,event_code ,dt ,event_time ,rawSnapshot from tmp.tmp_dm_event_cashLoanEvent_di_01_${zdt.addDay(-1).format("yyyyMMdd")}; alter table dm_finrisk.dm_event_cashLoanEvent_di drop if exists partition (day = ${zdt.addDay(-1).format("yyyyMMdd")}); insert overwrite table dm_finrisk.dm_event_cashLoanEvent_di partition (day = ${zdt.addDay(-1).format("yyyyMMdd")}) select event_uuid ,event_code ,dt ,event_time ,rawSnapshot from tmp.tmp_dm_event_cashLoanEvent_di_02_${zdt.addDay(-1).format("yyyyMMdd")}分析下上面代码

上面的代码主要是一个HiveQL脚本，用于从`dm_finrisk.ods_event_hdfs_snapshot_di`表中提取`code`为`shield@cashLoanEvent`且`day`为昨天日期的数据，并将其存储到`dm_finrisk.dm_event_cashLoanEvent_di`表中的对应分区中。具体来说，该脚本的执行步骤如下： 1. 第1行：设置Hive执行参数，包括动态分区模式、并行执行和并行执行线程数等。 2. 第3-8行：创建`dm_finrisk.dm_event_cashLoanEvent_di`表，该表包含5个列，分别为`event_uuid`、`event_code`、`dt`、`event_time`和`rawSnapshot`，其中`dt`为分区列。 3. 第10-15行：创建临时表`tmp.tmp_dm_event_cashLoanEvent_di_01_${zdt.addDay(-1).format("yyyyMMdd")}`，该表从`dm_finrisk.ods_event_hdfs_snapshot_di`表中选择`code`为`shield@cashLoanEvent`且`day`为昨天日期的记录，并将其中的`uuid`、`event`、`day`、`time`和`data`字段分别映射到`event_uuid`、`event_code`、`dt`、`event_time`和`rawSnapshot`列中。 4. 第17-22行：创建临时表`tmp.tmp_dm_event_cashLoanEvent_di_02_${zdt.addDay(-1).format("yyyyMMdd")}`，该表从临时表`tmp.tmp_dm_event_cashLoanEvent_di_01_${zdt.addDay(-1).format("yyyyMMdd")}`中选择所有列，用于后续的数据处理。 5. 第24行：如果`dm_finrisk.dm_event_cashLoanEvent_di`表中昨天的分区已经存在，则删除该分区。 6. 第26-27行：将临时表`tmp.tmp_dm_event_cashLoanEvent_di_02_${zdt.addDay(-1).format("yyyyMMdd")}`中的数据插入到`dm_finrisk.dm_event_cashLoanEvent_di`表的昨天分区中。整个脚本的作用是将来自`dm_finrisk.ods_event_hdfs_snapshot_di`表的特定数据提取出来，并存储到`dm_finrisk.dm_event_cashLoanEvent_di`表的对应分区中，以便后续的分析和查询。

df跟out_df怎么互相转化的df = self.load_to_intermediate(df) ConcurrencyControlUtils.create_database_if_not_exists(self.spark, self.database_name) df.write.format(self.config.destination_file_type).mode(self.config.write_mode). \ option("path", self.config.destination_data_path).saveAsTable(self.config.table_full_name) out_df = self.glueContext.create_dynamic_frame_from_catalog(self.database_name, self.table_name).toDF()

这段代码中，首先使用self.load_to_intermediate(df)方法将DataFrame对象df转化为另一个DataFrame对象，然后将转化后的DataFrame对象写入到Hive表中。具体来说，load_to_intermediate()方法是一个自定义方法，用于将DataFrame对象df进行一些必要的转换，以适应后续的处理。该方法的实现可以根据具体的需求进行编写，这里无法确定具体的实现方式。接着，使用ConcurrencyControlUtils.create_database_if_not_exists()方法创建名为self.database_name的数据库，如果该数据库已经存在则不进行任何操作。然后，使用DataFrame对象df的write()方法将DataFrame对象写入到Hive表中。在这里，使用了self.config.destination_file_type、self.config.write_mode和self.config.destination_data_path等参数，分别表示目标文件类型、写入模式和目标数据路径。该方法的实现会将DataFrame对象写入到指定的目录中，并将该目录作为Hive表的存储路径。最后，使用glueContext.create_dynamic_frame_from_catalog()方法读取Hive表中的数据，并将其转换为DataFrame对象out_df。其中，glueContext是一个GlueContext对象，表示当前的AWS Glue运行环境，create_dynamic_frame_from_catalog()方法是GlueContext对象中的一个方法，用于从Hive元数据中读取数据并将其转换为DynamicFrame对象，然后再将DynamicFrame对象转换为DataFrame对象。这里使用了self.database_name和self.table_name两个参数，分别表示数据库名和表名。

CREATE TABLE IF NOT EXISTS CDBILSDBA.T_SUBJECT_TEMPLATE_CONFIG

相关推荐

Judge-whether-a-file-exists.rar_vb exists

builtin-__fls.rar_if

C++编程中__if_exists与__if_not_exists语句的用法

CREATE TABLE IF NOT EXISTS mascdm_dwd_cloudpay_royalty_adb_dd

ConcurrencyControlUtils.create_database_if_not_exists(self.spark, self.database_name)

StatementCallback; bad SQL grammar [ create table if not exists fangan_test.ods_v1

if not os.path.exists(args.output_dir):

CREATE TABLE IF NOT EXISTS

if not os.path.exists(self.model_save_dir): os.makedirs(self.model_save_dir)

drop table if exists dept; create table if not exists dept

if not os.path.exists(self.origin_dir): os.makedirs(self.origin_dir)

update asks_over_time set is_replied = 1 where exists ( select t1.ask_id from asks t1 inner join asks_over_time t2 on t1.ask_id = t2.ask_id where t2.is_accepted = 1 and t1.handle_time is not null and t1.handle_time != '' and t1.handle_time >= t2.create_time and t2.ask_id = t1.ask_id) sql优化

CREATE USER IF NOT EXISTS 'observatory_admin'@'%' IDENTIFIED BY

if not os.path.exists(LOG_PATH):

最新推荐

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

前端深拷贝 和浅拷贝有哪些方式,你在哪里使用过

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

MATLAB柱状图在数据分析中的作用：从可视化到洞察

jsp页面如何展示后台返回的xml代码

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

关系数据表示学习

前端深拷贝和浅拷贝有哪些方式,你在哪里使用过