PyTorch学习率策略与模型保存实战

64 浏览量更新于2024-09-01 收藏 82KB PDF 举报

"本文主要探讨了PyTorch中学习率设置的重要性，并提供了两种常见的学习率调整策略：使用内置函数和自定义每个阶段的学习率。同时，介绍了如何在训练过程中保存和加载模型，以便于中断训练后继续进行。此外，还展示了使用`torch.optim.lr_scheduler`进行学习率调度的示例。" 在深度学习模型训练中，学习率是优化器的一个关键参数，它决定了每次参数更新的幅度。合适的学习率设置对于模型的收敛速度和最终性能至关重要。PyTorch提供了一些内置的方法来帮助我们管理学习率，我们可以选择使用这些函数或者手动设定不同阶段的学习率。首先，我们可以使用PyTorch的优化器（如`optim.Adam`或`optim.SGD`）自带的学习率调度功能。例如，在上面的代码中，使用`optim.Adam`初始化网络参数时，设置了初始学习率为0.001。如果希望在训练过程中逐步减小学习率，可以使用`lr_scheduler`模块，如`StepLR`，它允许在预设的周期内降低学习率。这样可以确保模型在训练初期快速探索权重空间，然后在后期精细调整。 ```python scheduler = lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1) ``` 在上述代码中，`step_size`指定了每经过多少个epoch降低一次学习率，`gamma`表示每次降低的比例。另一方面，如果希望自定义学习率的调整策略，可以在训练循环中手动设置。例如，当模型的准确率在某个阈值附近停滞不前时，可以减小学习率，如从0.001降低到0.0001，以期望模型能在当前解决方案附近进一步优化。这可以通过监测训练指标并在满足特定条件时修改`optimizer.param_groups`中的学习率来实现。 ```python if epoch > 10 and epoch % 5 == 0: for param_group in optimizer.param_groups: param_group['lr'] *= 0.1 ``` 模型保存与加载是训练过程中的另一个重要环节。在训练期间，应定期保存模型的状态，包括网络权重、优化器状态以及当前的训练轮数和损失值，以便在需要时能够恢复训练。PyTorch提供`torch.save()`和`torch.load()`函数实现这一功能。 ```python # 保存模型 torch.save({ 'epoch': epoch, 'model_state_dict': net.state_dict(), 'optimizer_state_dict': optimizer.state_dict(), 'loss': loss }, PATH) # 加载模型 checkpoint = torch.load(PATH) net.load_state_dict(checkpoint['model_state_dict']) optimizer.load_state_dict(checkpoint['optimizer_state_dict']) epoch = checkpoint['epoch'] loss = checkpoint['loss'] ``` 学习率的恰当设置是训练深度学习模型的关键，而PyTorch提供了一系列工具来帮助我们实现这一目标。通过监控训练过程、适时调整学习率并妥善保存模型状态，我们可以有效地提升模型的训练质量和效率。

pytorch 实现学习率设置实现学习率设置观察数据具体调整观察数据具体调整

摘要摘要

学习率的设置也是训练好模型的关键点之一，所以需要掌握常用的学习率的设置，一种是使用自带函数，另一种是自己设置每

个阶段的学习率作为调整，

模型保存方式模型保存方式

在学习率调整的时候你是没有办法直接感觉多少epoch能训练出来，所以保存模型的时候最好是可以继续训练的形式，例如我

在训练102分类的时候acc达到93的时候基本很难再增进了这时候就要在考虑一下学习率的设置，开始的时候全程0.001，所以

这时候将学习率改为0.0001会有更好的效果。所以保存可以中断训练继续的保存很重要

net = resnet50.Resnet().cuda()

criterion = nn.CrossEntropyLoss()

optimizer = optim.Adam(net.parameters(),lr=0.001)

checkpoint = torch.load(PATH)

net.load_state_dict(checkpoint['model_state_dict'])

optimizer.load_state_dict(checkpoint['optimizer_state_dict'])

epoch = checkpoint['epoch'] loss = checkpoint['loss']

#这部分是加载，只有训练一次之后才有的模型可以这样加载，对应保存部分

torch.save({'epoch':epoch,

'model_state_dict': net.state_dict(),

'optimizer_state_dict': optimizer.state_dict(),

'loss': loss

},PATH)

#这部分代码写在每个训练当中进行保存，

自带函数调整自带函数调整

import torch

import torch.optim as optim

from torch.optim import lr_scheduler

from torchvision.models import AlexNet

import matplotlib.pyplot as plt

model = AlexNet(num_classes=2)

optimizer = optim.SGD(params=model.parameters(), lr=0.05)

# lr_scheduler.StepLR()

# Assuming optimizer uses lr = 0.05 for all groups

# lr = 0.05 if epoch < 30

# lr = 0.005 if 30 <= epoch < 60

# lr = 0.0005 if 60 <= epoch < 90

scheduler = lr_scheduler.StepLR(optimizer, step_size=30, gamma=0.1)

plt.figure()

x = list(range(100))

y = [] for epoch in range(100):

scheduler.step()

lr = scheduler.get_lr()

print(epoch, scheduler.get_lr()[0])

y.append(scheduler.get_lr()[0])

plt.plot(x, y)

plt.show()

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38502292

粉丝: 5

PyTorch学习率策略与模型保存实战

基于yolov5,yolov7,yolov8的车牌检测源码（准确率高达99.5% 还有车牌数据集提供下载）.zip

4-DCGAN实战.ipynb

深度学习各类学习率调整策略示例代码

yolov5学习率如何设置

如何利用Swin-Transformer和迁移学习在PyTorch框架下对花数据集进行分类，并根据学习率曲线和混淆矩阵评估模型性能？

基于Pytorch实现多层感知机回归预测，一共有15000个数据样本，13个特征，如何设置batch_size, epoch，学习率，隐藏层层数及神经元个数以及其他参数？应该选用什么优化器比较好？

faster r-cnn的pytorch版源码微调自己的数据集

pytorch准确率只有百分之一

多粒度粒球计算模型pytorch代码实例，要求代码可以设置超参数调整

在使用Swin-Transformer和迁移学习对花数据集进行图像分类时，如何根据混淆矩阵和精度计算来评估模型性能，并解释学习率曲线的重要性？

最新资源