卡 方 散 度 是 F 散 度 的 一 种 形 式 , 衡 量 2 个 分 布 , 即 P=(p1,p2,
⋯,pn)P=(p1,p2,⋯,pn)和 Q=(q1,q2,⋯,qn)Q=(q1,q2,⋯,qn):差 异 的 大 小 , 其
被定义为
χ2(P∥Q)=∑i=1n(pi−qi) 2qi=∑i=1n(pi) 2qi−1
(3)χ2(P‖Q)=∑i=1n(pi−qi) 2qi=∑i=1n(pi) 2qi−1 (3)
该 散 度 满 足 非 负 性 , 当 且 仅 当 P 和 Q 完 全 相 同 时 ,
χ2(P∥Q)=0χ2(P‖Q)=0 。 相 比 于 熵 , 如 GAN 中 典 型 的 交 叉 熵
D(P∥Q)=∑i=1npilogpiqiD(P‖Q)=∑i=1npilogpiqi,卡方散度没有对数和指数运
算,其计算复杂度小,运算速度较快。卡方散度 χ2(P∥Q)χ2(P‖Q):与交叉熵
D(P∥Q)D(P‖Q):的关系满足 0≤D(P∥Q)≤χ2(P∥Q)0≤D(P‖Q)≤χ2(P‖Q),表明
基于卡方散度的方法比交叉熵法有更好的抗噪性能
[45
]
。量化敏感性表现为卡方距
离对不同输入与标准模板之间的细微差异是敏感的。由于不同噪声服从不同的
概率分布,当 z 服从参数为 λ 的泊松分布,且 λ 充分大时,z 渐近服从正态分布
N(λ,λ);当 z 服从参数为 α 和 β 的伽马分布,且 α 趋于无穷大时,z 渐近服从正
态分布 N(αβ,αβ2)N(αβ,αβ2)。虽然不同分布在极限条件下存在一定的关系,但
是一般情况下很难达到极限条件。因此,不同输入噪声拟合出的生成样本分布
具有一定的差异,即其与真实样本分布的距离也各不相同;卡方散度的量化敏
感性可以度量不同噪声下生成样本分布与真实样本分布的差异,有利于减小不
同噪声对生成样本分布的影响,因此使用卡方散度有助于缓解不同输入噪声下
的稳健性问题。
卡方散度的稀疏不变性的定义是整体距离等于局部最优距离。由于真实样
本中可能存在一些质量较差或不服从整体分布的独立样本,如果生成样本分布
无限拟合真实样本分布,会产生独立样本,影响判别器和生成器的训练。此时,
卡方散度的稀疏不变性有利于从整体数据中忽略独立样本,使用局部最优样本
分布来代替整体分布。所以,将卡方散度作为样本分布差异的评价依据,可以
降低对真实样本质量的要求,同时避免生成一些质量较差的独立样本。
因此,基于卡方散度构建卡方生成对抗网络的目标函数,如式 (4)所示。根
据极大极小值原理,判别器 D 希望生成器生成的图像质量较差,从而轻易地判
别出真实样本和生成样本。生成器 G 根据判别器的反馈优化自身,直到可以混
淆判别器的判断。
maxGminDK(D,G)=Ez~pz(z)[D2(G(z))]−Ex~pd(x)[D(x)]
(4)maxGminD:K(D,G)=Ez~pz(z)[D2(G(z))]−Ex~pd(x)[D(x)] (4)