生成模型新星:DDPM与扩散模型解析

需积分: 3 0 下载量 2 浏览量 更新于2024-08-04 收藏 1.19MB PDF 举报
"这篇文章主要探讨了DDPM(Diffusion Probabilistic Models),这是一种在生成模型领域逐渐崭露头角的方法,特别是在OpenAI的DALL·E2和Google的Imagen等先进文本生成图像技术中占据核心地位。作者苏剑林通过一系列文章介绍了DDPM的基本概念和推导方式,试图打破其被误解的高数学复杂性的印象,提供更易于理解的解释。" DDPM,全称为扩散概率模型,是一种用于生成高质量图像和其他数据类型的强大工具。传统的生成模型,如变分自编码器(VAE)和生成对抗网络(GAN),已经在多个领域得到了广泛应用。然而,DDPM通过一种独特的机制,即逐步“扩散”和“去噪”的过程,来生成复杂的高分辨率图像,这一过程可以被比喻为“拆楼+建楼”。 在生成扩散模型的通俗类比方案中,DDPM的生成过程被描述为先将数据(如图像)看作是经过一系列随机噪声过程破坏的结果,然后通过反向的、逐步去除噪声的过程来恢复原始数据。这个过程类似于建筑拆除和重建,使得模型能够学习如何从噪声中重建出清晰的图像。 另一方面,DDPM也可以被视作一个变分自编码器的变种,通过自回归式的建模来学习数据的分布。这一方法虽然理论上更完整,但可能显得较为抽象,不太直观。此外,DDPM还与贝叶斯定理有密切关系,利用贝叶斯定理可以简化计算,使得模型的推导过程更具启发性。 在生成扩散模型的第三部分中,作者进一步探讨了利用贝叶斯定理进行推导的方法,这为理解DDPM的内部工作原理提供了新的视角。贝叶斯定理是概率论中的一个重要工具,它允许我们根据先验知识更新对事件概率的理解。在DDPM中,这可能意味着模型可以利用已有的信息来逐步提高其对数据的估计,从而更准确地还原出原始图像。 DDPM作为一种生成模型,不仅在技术上具有先进性,而且在理论理解和直观解释上也在不断探索和发展。通过不同的推导角度,研究者和实践者可以更好地掌握这种模型的工作原理,并将其应用于更多创新领域,如文本到图像生成、视频生成等。随着技术的进步,DDPM有望在人工智能和智能AI领域发挥更大的作用。

insert overwrite table discountdw.dwd_sd_adds_order_bill_inc partition(dt = '2023-06-06') select t1.order_bill_id, t1.counterfoil_no, t1.acceptor, date_format(to_utc_timestamp(cast(t1.expiry_date as bigint) ,'GMT-8'),'YYYY-MM-dd'), t2.company_id, t1.cert_no, t1.company_name, t1.third_order_id, t1.counterfoil_amt/10000, t1.transaction_amt/10000, t1.rate, '3bp' as service_tariffing, ((DATEDIFF(to_utc_timestamp(t1.expiry_date ,'GMT-8'),to_utc_timestamp(t1.transaction_date ,'GMT-8') ) + adjust_days)* 0.0003 *(counterfoil_amt))/ 360 as service_fee, 360 as total_days, DATEDIFF(to_utc_timestamp(t1.expiry_date ,'GMT-8'),to_utc_timestamp(t1.transaction_date ,'GMT-8') ) + adjust_days as modulation_date, t3.channel_type, t3.bank_name, date_format(to_utc_timestamp(cast(t1.transaction_date as bigint) ,'GMT-8'),'YYYY-MM-dd'), t1.order_status_code, t1.order_status_msg, t4.fee_amt, t4.status, t1.tenant_id, t5.revenue, to_utc_timestamp(cast(t1.create_date as bigint) ,'GMT-8'), to_utc_timestamp(cast(t1.update_date as bigint) ,'GMT-8') from (select * from discountdw.ods_adds_order_bill_inc where dt ='2023-06-06' and channel_id=101110004 )t1 left join (select * from mecdw.ods_company_full where platform_id='sdpjw')t2 on t1.cert_no=t2.cert_no and t1.tenant_id=t2.tenant_id left join discountdw.dim_adds_product_full t3 on t1.partner_id=t3.partner_id and t1.product_id=t3.product_id left join (select * from mecdw.dwd_sc_fee_record_full where dt='2023-06-06' and biz_type=2 ) t4 on t1.order_bill_id=t4.third_id left join (select * from discountdw.ods_sd_order_ext_inc where dt='2023-06-06') t5 on t1.order_bill_id=t5.order_bill_id left join sdpjwdw.dim_holiday_info_full t6 on date_format(to_utc_timestamp(t1.expiry_date ,'GMT-8'),'YYYY-MM-dd') = t6.civic_holiday ;

2023-06-09 上传