交叉熵损失的计算公式
时间: 2023-11-17 13:57:49 浏览: 69
分类问题损失函数 – 交叉熵
交叉熵损失是深度学习中常用的一种损失函数,用于衡量模型预测结果与真实标签之间的差距。对于一个三分类问题,样本经过模型最后的FC层的输出向量(即logits)为 $z=[z_1,z_2,z_3]$,则三个类别的预测概率依次为 $p_1=\frac{e^{z_1}}{e^{z_1}+e^{z_2}+e^{z_3}},p_2=\frac{e^{z_2}}{e^{z_1}+e^{z_2}+e^{z_3}},p_3=\frac{e^{z_3}}{e^{z_1}+e^{z_2}+e^{z_3}}$。假设样本的概率分布为 $y=[y_1,y_2,y_3]$,则交叉熵损失函数为 $L=-\sum_{i=1}^{3}y_i\log p_i$。其中,$\log$表示以e为底的自然对数。交叉熵损失函数的计算公式可以用于反向传播算法中,通过最小化损失函数来更新模型参数,使得模型的预测结果更加准确。
阅读全文