PyTorch深度学习常见损失函数详解

版权申诉

159 浏览量更新于2024-08-11 收藏 198KB PDF 举报

深度学习中的损失函数起着至关重要的作用，它衡量了模型预测结果与真实值之间的差异，是评估模型性能的关键指标。在深度学习框架PyTorch中，提供了丰富的损失函数供开发者选择，以适应不同类型的任务和模型需求。本篇文章将详细介绍19种常见的深度学习损失函数： 1. **均方误差损失（MSELoss）**: 用于回归任务，计算预测值与实际值之间差的平方的平均，表达式为 \( L(Y, prediction(x)) = \frac{1}{N}\sum_{i=1}^{N}(y_i - prediction(x_i))^2 \)。 2. **交叉熵损失（CrossEntropyLoss）**: 主要用于分类任务，衡量预测概率分布与真实类别分布的差异，适合多类别的概率预测，如softmax激活后的输出。 3. **KL散度损失（KLDivLoss）**: 用于衡量两个概率分布之间的差异，常用于对比两个连续概率分布。 4-6. **L1/L2范数损失**：L1 Loss侧重于找出离散的错误，而L2 Loss对大误差更敏感。平滑L1 Loss结合两者优点，对小误差线性处理，大误差绝对值处理。 7-8. **二进制交叉熵损失（BCELoss/BCEWithLogitsLoss）**: 分别用于二分类问题和带有logits的二分类问题，衡量预测概率与实际类别之间的差异。 9-10. **多分类损失（SoftMarginLoss/MultiLabelSoftMarginLoss）**: 多类别的逻辑回归损失，适用于多标签分类。 11. **多标签margin损失（MultiLabelMarginLoss）**: 强调每个标签的重要性，对于误分类有较大的惩罚。 12-13. **余弦损失（CosineEmbeddingLoss）/多类别Hinge损失（MultiMarginLoss）**: 用于度量向量之间的相似度，适用于特征嵌入和多类别分类。 14. **三元组损失（TripletMarginLoss）**: 用于实现深度学习中的实例级学习，优化样本间的距离关系。 15. **连接时序分类损失（CTCLoss）**: 用于语音识别等序列标注任务，关注整个序列的最优路径。 16-17. **负对数似然损失（NLLLoss/NLLLoss2d）**: 一般用于分类任务，对每个类别的概率进行归一化并取负对数。 18. **泊松损失（PoissonNLLLoss）**: 适用于预测整数值的场景，如自然语言处理中的词频计数。 19. **边际排名损失（MarginRankingLoss）**: 用于排序任务，优化预测结果之间的相对顺序。每种损失函数的选择取决于具体的应用场景和任务需求，理解其背后的数学原理和适用范围有助于提高模型的性能和稳定性。在实际项目中，根据任务特性灵活运用这些损失函数，并结合模型的正则化策略，能够帮助优化深度学习模型的训练过程。

深度学习损失函数原理解析（⼀）

在深度学习中，我们经常⽤到损失函数，损失函数选择使⽤情况直接决定我们模型训练效果。在pytorch深度学习中存在很多种损失函数。

主要分为19种。

1、均⽅误差损失 MSELoss

2、交叉熵损失 CrossEntropyLoss

3、KL 散度损失 KLDivLoss

4、L1范数损失（L1_loss）

5、L2范数损失（L2_loss）

6、平滑版L1损失 SmoothL1Loss

7、⼆进制交叉熵损失 BCELoss

8、BCEWithLogitsLoss

9、HingeEmbeddingLoss

10、2分类的logistic损失 SoftMarginLoss

11、多标签分类损失 MultiLabelMarginLoss

12、多标签 one-versus-all 损失 MultiLabelSoftMarginLoss

13、cosine 损失 CosineEmbeddingLoss

14、多类别分类的hinge损失 MultiMarginLoss

15、三元组损失 TripletMarginLoss

16、连接时序分类损失 CTCLoss

17、负对数似然损失 NLLLoss

18、NLLLoss2d

19、PoissonNLLLoss

8、MarginRankingLoss

下⾯将按照顺序进⾏损失函数介绍。

1.前⾔

损失函数是深度学习与机器学习⾥⾯的重要函数。从字⾯意思可确定，损失函数（Loss Function）反应的是模型对数据的拟合程度。损失

函数越⼩，说明模型对数据拟合程度越好，反之拟合程度越差。

损失函数是⽤来估量模型的预测值prediction(x)与真值Y之间的不⼀致问题，⾮负值函数，通常L(Y,prediction(x))表⽰损失函数公式，损

失函数越好，鲁棒性越好，损失函数是经验风险函数的核⼼部分，也是结构风险函数的重要组成部分。模型的结构风险函数包括了经验风险

项和正则项，通常可以表⽰成如下式⼦：

其中，前⾯的均值函数表⽰的是经验风险损失函数，L表⽰的是损失函数，后⾯的是正则化项。

本⽂主要收集和整理了深度学习常⽤的损失函数，给出函数表达形式，以及使⽤介绍和应⽤场景。

2.常⽤损失函数

**2.1 均⽅差函数（MSE）

概念：均⽅差损失函数是预测值和原始数据对应点误差的平⽅和的均值，

公式：

N个样本数。

pytorch中实例演⽰：

代码：

下载后可阅读完整内容，剩余4页未读，立即下载

_webkit

粉丝: 31
资源: 1万+

PyTorch深度学习常见损失函数详解

深度学习BP模型原理解析与Python实现

深度学习之Manning.Grokking深度学习解析

MATLAB深度学习：简单NN实现解析

深度学习基础及数学原理.pdf

dqn走迷宫matlab-深度强化学习DQN（DeepQNetwork）原理及例子：如何解。。。 深度学习原理.pdf

基于生活化问题的深度学习.pdf

matlab-深度学习总结.pdf

生成对抗网络原理及代码解析.pdf

深度学习常见面试题.pdf

算法工程师思维导图—深度学习篇.pdf

最新资源

dqn走迷宫matlab-深度强化学习DQN（DeepQNetwork）原理及例子：如何解。。。深度学习原理.pdf