latent diffusion vae损失函数
时间: 2023-11-27 14:05:08 浏览: 174
High-Resolution Image Synthesis with Latent Diffusion Models.pdf
Latent Diffusion Variational Autoencoder(LD-VAE)的损失函数分为两部分:重建损失和KL散度损失。
重建损失定义为:
$$
\mathcal{L}_{\text{rec}} = \frac{1}{N}\sum_{i=1}^N\|\boldsymbol{x}_i - \hat{\boldsymbol{x}}_i\|^2_2
$$
其中,$\boldsymbol{x}_i$表示输入样本,$\hat{\boldsymbol{x}}_i$表示经过解码器解码之后得到的重建样本,$N$表示样本数量。
KL散度损失定义为:
$$
\mathcal{L}_{\text{KL}} = \frac{1}{N}\sum_{i=1}^N\text{KL}\left(\mathcal{N}(\boldsymbol{z}_i; \boldsymbol{\mu}_i, \boldsymbol{\sigma}_i^2) \| \mathcal{N}(\boldsymbol{z}_i; \boldsymbol{0}, \boldsymbol{I})\right)
$$
其中,$\boldsymbol{z}_i$表示隐变量,$\boldsymbol{\mu}_i$和$\boldsymbol{\sigma}_i$分别表示编码器输出的均值和标准差,$\mathcal{N}(\cdot)$表示高斯分布,$\text{KL}(\cdot \| \cdot)$表示KL散度。
最终的损失函数为:
$$
\mathcal{L} = \mathcal{L}_{\text{rec}} + \beta \cdot \mathcal{L}_{\text{KL}}
$$
其中,$\beta$是一个超参数,用于控制重建损失和KL散度损失之间的权重。通常情况下,$\beta$的取值范围为0.1到10之间。
阅读全文