Pytorch快速入门：构建模型的步骤

PDF格式 | 111KB | 更新于2024-08-31 | 150 浏览量 | 举报

"本文主要介绍了如何使用PyTorch构建自定义模型，对比TensorFlow的特点，并提供了一个简单的MNIST手写数字识别模型的示例代码。PyTorch因其对Numpy特性的良好支持和易用性而受到欢迎。" 在PyTorch中构建模型的步骤与TensorFlow有所不同，但核心思想相似，都是为了定义网络结构和实现前向传播过程。以下是使用PyTorch搭建模型的关键点： 1. **模型定义**： PyTorch中的模型通常通过继承`nn.Module`类来创建。在这个基类中，我们需要重写`__init__()`方法来定义网络的层次结构，以及一个`forward()`方法，用于定义数据流经网络的逻辑。在`__init__()`方法中，我们可以创建`nn.Module`子类的实例，如`nn.Linear`、`nn.Conv2d`等，这些子类代表了不同的层。`forward()`方法则定义了输入数据如何通过这些层进行处理。示例代码中，`ModelTest`类继承自`nn.Module`，并定义了四个全连接层（`nn.Linear`）和激活函数（`nn.ReLU`，`nn.Softmax`）。`self.to(device)`用于将模型的所有参数移动到指定的设备，如GPU（`cuda`）。 2. **初始化模型**：在模型定义后，我们可以创建模型实例并将其放在适当的设备上。例如，`device=torch.device('cuda')`将设备设置为GPU，如果可用的话。然后在模型类的实例化时调用这个设备，如`model = ModelTest(device)`。 3. **定义层和参数**：示例中，`nn.Sequential`是一个方便的容器，它可以将多个层串联起来。每个`Sequential`对象代表了一个独立的层。例如，`self.layer1`包含了`Flatten`（将输入展平）、一个线性层和ReLU激活函数。 4. **优化器设置**：要进行训练，我们需要一个优化器来更新模型的参数。PyTorch提供了多种优化器，如`SGD`（随机梯度下降）、`Adam`等。`self.opt=optim.SGD(self.parameters(), lr=0.01)`创建了一个`SGD`优化器，其中`self.parameters()`获取模型的所有可训练参数，`lr`是学习率。 5. **前向传播和损失计算**：在`forward()`方法中，我们将输入数据传入模型，得到预测输出。计算损失（loss）通常在模型的输出和实际标签之间进行，PyTorch提供了多种损失函数，如`nn.CrossEntropyLoss`适用于分类问题。训练过程中，我们还需要反向传播误差并更新权重。 6. **训练流程**：训练模型通常包括以下步骤：前向传播、计算损失、反向传播和权重更新。这可以通过`optimizer.zero_grad()`（清零梯度）、`loss.backward()`（反向传播）、`optimizer.step()`（更新权重）完成。 7. **模型评估与测试**：完成训练后，可以使用验证集或测试集评估模型的性能。PyTorch提供了便利的工具，如`torchmetrics`库，来计算准确率、精度、召回率等指标。 PyTorch以其直观的API和对Numpy的兼容性，使得模型构建变得简单而灵活。通过理解以上关键点，开发者可以快速地在PyTorch中构建和训练复杂的深度学习模型。

使用使用Pytorch搭建模型的步骤搭建模型的步骤

　　本来是只用Tenorflow的，但是因为TF有些Numpy特性并不支持，比如对数组使用列表进行切片，所以只能转战Pytorch

了（pytorch是支持的）。还好Pytorch比较容易上手，几乎完美复制了Numpy的特性（但还有一些特性不支持），怪不得热度

上升得这么快。

1 模型定义模型定义

　　和TF很像，Pytorch也通过继承父类来搭建自定义模型，同样也是实现两个方法。在TF中是__init__()和call()，在Pytorch

中则是__init__()和forward()。功能类似，都分别是初始化模型内部结构和进行推理。其它功能比如计算loss和训练函数，你也

可以继承在里面，当然这是可选的。下面搭建一个判别MNIST手写字的Demo，首先给出模型代码：

import numpy as np

import matplotlib.pyplot as plt

import torch

from torch import nn,optim

from torchsummary import summary

from keras.datasets import mnist

from keras.utils import to_categorical

device = torch.device('cuda') #——————1——————

class ModelTest(nn.Module):

def __init__(self,device):

super().__init__()

self.layer1 = nn.Sequential(nn.Flatten(),nn.Linear(28*28,512),nn.ReLU())#——————2——————

self.layer2 = nn.Sequential(nn.Linear(512,512),nn.ReLU())

self.layer3 = nn.Sequential(nn.Linear(512,512),nn.ReLU())

self.layer4 = nn.Sequential(nn.Linear(512,10),nn.Softmax())

self.to(device) #——————3——————

self.opt = optim.SGD(self.parameters(),lr=0.01)#——————4——————

def forward(self,inputs): #——————5——————

x = self.layer1(inputs)

x = self.layer2(x)

x = self.layer3(x)

x = self.layer4(x)

return x

def get_loss(self,true_labels,predicts):

loss = -true_labels * torch.log(predicts) #——————6——————

loss = torch.mean(loss)

return loss

def train(self,imgs,labels):

predicts = model(imgs)

loss = self.get_loss(labels,predicts)

self.opt.zero_grad()#——————7——————

loss.backward()#——————8——————

self.opt.step()#——————9——————

model = ModelTest(device)

summary(model,(1,28,28),3,device='cuda') #——————10——————

　　#1：获取设备，以方便后面的模型与变量进行内存迁移，设备名只有两种：’cuda’和’cpu’。通常是在你有GPU的情况下需

要这样显式进行设备的设置，从而在需要时，你可以将变量从主存迁移到显存中。如果没有GPU，不获取也没事，pytorch会

默认将参数都保存在主存中。

　　#2：模型中层的定义，可以使用Sequential将想要统一管理的层集中表示为一层。

　　#3：在初始化中将模型参数迁移到GPU显存中，加速运算，当然你也可以在需要时在外部执行model.to(device)进行迁

移。

　　#4：定义模型的优化器，和TF不同，pytorch需要在定义时就将需要梯度下降的参数传入，也就是其中的

self.parameters()，表示当前模型的所有参数。实际上你不用担心定义优化器和模型参数的顺序问题，因为self.parameters()

的输出并不是模型参数的实例，而是整个模型参数对象的指针，所以即使你在定义优化器之后又定义了一个层，它依然能优化

到。当然优化器你也可以在外部定义，传入model.parameters()即可。这里定义了一个随机梯度下降。

　　#5：模型的前向传播，和TF的call()类似，定义好model()所执行的就是这个函数。

　　#6：我将获取loss的函数集成在了模型中，这里计算的是真实标签和预测标签之间的交叉熵。

　　#7/8/9：在TF中，参数梯度是保存在梯度带中的，而在pytorch中，参数梯度是各自集成在对应的参数中的，可以使用

tensor.grad来查看。每次对loss执行backward()，pytorch都会将参与loss计算的所有可训练参数关于loss的梯度叠加进去（直

下载后可阅读完整内容，剩余4页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

weixin_38519387

粉丝: 3

Pytorch快速入门：构建模型的步骤

如何使用Pytorch搭建模型

基于Pytorch搭建Faster R-CNN实现飞机目标检测-数据集

利用pytorch 搭建猫狗公鸡图片分类网络

使用PyTorch搭建简单RNN模型

使用PyTorch搭建LSTM模型

pytorch搭建LSTM模型的步骤

如何使用pytorch搭建图像识别模型

使用pytorch搭建

使用pytorch搭建AlexNet操作(微调预训练模型及手动搭建)

使用PyTorch搭建Vision Transformer网络进行图像分类

最新资源