交叉熵损失的反向求导
时间: 2023-11-02 19:53:56 浏览: 120
机器学习 + 交叉熵损失、反向传播、逻辑回归 + 交叉熵损失结合反向传播算法手动实现逻辑回归 + 手动复现提高coding能力
交叉熵损失函数是常用于分类问题的损失函数之一。对于二分类问题,假设模型输出为 y,真实标签为 t,则交叉熵损失可以表示为:L = -t * log(y) - (1 - t) * log(1 - y)。
要求交叉熵损失的反向导数,我们需要先对 y 进行求导。根据链式法则,有:
∂L/∂y = -t/y + (1 - t)/(1 - y)
然后我们可以继续对 y 进行求导。由于 y 是模型的输出,通常使用激活函数进行转换,比如 sigmoid 函数。假设 a 是 sigmoid 函数的输出,则有 y = sigmoid(a)。
根据 sigmoid 函数的导数性质,有:
∂y/∂a = y * (1 - y)
接下来,我们可以继续求解 ∂L/∂a:
∂L/∂a = (∂L/∂y) * (∂y/∂a) = (-t/y + (1 - t)/(1 - y)) * (y * (1 - y)) = y - t
所以,交叉熵损失函数对模型输出 a 的导数为 y - t。
阅读全文