PyTorch学习：过拟合与欠拟合解析

pytorch

143 浏览量更新于2024-08-30 收藏 1.29MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"PyTorch学习2：过拟合与欠拟合，训练误差与泛化误差的概念，K折交叉验证方法，以及防止过拟合的策略" 在PyTorch学习中，理解过拟合和欠拟合的概念至关重要，它们是机器学习模型训练过程中常见的问题。训练误差（training error）是指模型在训练数据集上的表现，即模型在训练数据上的预测误差。而泛化误差（generalization error）则是模型在未见过的新样本上的预期误差，它是评估模型真实性能的关键指标。模型的目标是降低泛化误差，而非仅仅优化训练误差。过拟合（overfitting）和欠拟合（underfitting）是两种主要的拟合问题。欠拟合是指模型无法有效地拟合训练数据，表现为训练误差较高，同时模型可能过于简单，无法捕捉数据集中的复杂模式。而过拟合则相反，模型在训练数据上表现极佳，但对新数据的泛化能力较差，这是因为模型过度学习了训练数据中的噪声和细节，导致对一般规律的把握不足。为了平衡训练和泛化，K折交叉验证是一种常用的技巧。它将数据集划分为K个互斥的子集，每次用K-1个子集进行训练，剩下的一个子集用于验证。重复K次，确保每个子集都被用来验证一次，最后取平均结果作为模型性能的评估。这种方法有效利用了有限的训练数据，减少了因验证数据过多而导致的训练样本不足的问题。针对过拟合，有多种策略可以采取： 1. 增加训练数据：更多的数据可以帮助模型更好地学习数据的普遍规律，减少对特定训练样本的依赖。 2. L2正则化：通过在损失函数中添加权重参数的平方和，使得模型在训练过程中倾向于选择较小的权重，从而限制模型复杂度，防止过拟合。 3. 丢弃法（dropout）：在训练过程中随机关闭一部分神经元，强迫模型学习多个不同的表示，增强模型的泛化能力。此外，PyTorch中的一些函数也在此处提及，如`torch.cat()`用于沿指定维度合并张量，`pow(input, exponent)`用于计算张量的指数值，而`torch.zeros_like(X)`则生成与给定张量X形状相同且所有元素均为零的新张量。这些基本操作在构建和训练神经网络时非常常见，是理解和实现PyTorch模型的基础。

资源详情

资源推荐

pytorch学习学习2

1、过拟合和欠拟合、过拟合和欠拟合

训练误差和泛化误差在解释上述现象之前，我们需要区分训练误差（training error）和泛化误差（generalization error）。通俗来讲，前者指模型在训练数据集上表现出的误差，后者

指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数，例如线性回归用到的平

方损失函数和softmax回归用到的交叉熵损失函数。机器学习模型应关注降低泛化误差。K折交叉验证由于验证数据集不参与模型训练，当训练数据不够用时，预留大量的验证数据显

得太奢侈。一种改善的方法是K折交叉验证（K-fold cross-validation）。在K折交叉验证中，我们把原始训练数据集分割成K个不重合的子数据集，然后我们做K次模型训练和验证。

每一次，我们使用一个子数据集验证模型，并使用其他K-1个子数据集来训练模型。在这K次训练和验证中，每次用来验证模型的子数据集都不同。最后，我们对这K次训练误差和验

证误差分别求平均。过拟合和欠拟合接下来，我们将探究模型训练中经常出现的两类典型问题：

* 一类是模型无法得到较低的训练误差，我们将这一现象称作欠拟合（underfitting）；

* 另一类是模型的训练误差远小于它在测试数据集上的误差，我们称该现象为过拟合（overfitting）。在实践中，我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这

两种拟合问题，在这里我们重点讨论两个因素：模型复杂度和训练数据集大小。

给定训练数据集，模型复杂度和误差之间的关系：

训练数据集大小训练数据集大小

影响欠拟合和过拟合的另一个重要因素是训练数据集的大小。一般来说，如果训练数据集中样本数过少，特别是比模型参数数量（按元素计）更少时，过拟合更容易发生。此外，泛

化误差不会随训练数据集里样本数量增加而增大。因此，在计算资源允许的范围之内，我们通常希望训练数据集大一些，特别是在模型复杂度较高时，例如层数较多的深度学习模

型。防止过拟合的方法：

（1）增加训练数据

（2）L2正则化

（3）丢弃法（dropout）

torch.cat(input1,,input2,1) #按列合并并

pow（input,exponent）#求张量input的exponent次值

torch.zeros_like(X) #用于生成和输入tensor大小相同的全零tensor的。

model.train() #启用 BatchNormalization 和 Dropout

model.eval() #不启用 BatchNormalization 和 Dropout

pd.get_dummies(all_features, dummy_na=True) #将离散数值改为特征

、梯度消失、梯度爆炸、梯度消失、梯度爆炸

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38679839

粉丝: 4
资源: 975

PyTorch学习：过拟合与欠拟合解析

PyTorch深度学习实践_pytorch_深度学习_

PyTorch深度学习代码及数据PyTorch深度学习代码及数据

pytorch学习日志，深度学习资源整理

PyTorch学习书籍推荐

龙良曲pytorch学习笔记

pytorch学习方法200字

pytorch学习方法1000字

pytorch学习方法100字

pytorch学习率是什么意思

pytorch深度学习教程

pytorch深度学习实战

pytorch学习python基础

PyTorch框架怎么学习

pytorch学习方法1-00字

pytorch怎么学习、

学习pytorch之前学习先学习什么

学习pytorch用学习numpy吗

pytorch学习方法

pytorch学习资源

pytorch深度学习全书

最新资源