自定义Pytorch全连接层：nn.Module实践

173 浏览量更新于2024-08-29 1 收藏 485KB PDF 举报

PyTorch是一个广泛使用的深度学习框架，其神经网络工具箱torch.nn为构建和训练深度学习模型提供了强大的支持。在这个章节中，主要关注的是如何利用torch.nn.Module来创建自定义的神经网络层，如全连接层（也称为线性层）。 4.1 nn.Module `nn.Module` 是 `torch.nn` 模块的核心，它是一个抽象基类，用于表示深度学习模型中的每个可训练组件。通过继承 `nn.Module`，开发者可以方便地定义新的层，并利用框架提供的便利功能，如自动求导、参数管理等。在 `nn.Module` 中，重要的概念包括： 1. 构造方法 (`__init__`)： - 类中的构造方法带有双下划线，这是Python的特殊语法，表示它是魔术方法，会在实例化时被解释器自动调用。 - `super(Linear, self).__init__()` 表示子类 `Linear` 继承自 `nn.Module`，并调用父类的构造方法初始化。 - 在构造方法中，开发者需要明确指定可学习的参数，例如权重 `w` 和偏置 `b`。这些参数通过 `nn.Parameter` 包装，使得它们可以被框架跟踪并更新。 2. 参数管理： - `nn.Parameter` 是 `nn.Module` 的一个重要特性，它将 `torch.Tensor` 转换为可训练的参数，即在反向传播中可以自动调整的变量。`nn.Parameter` 要求其内部的 `Variable` 具备 `requires_grad` 属性，以便在梯度计算时考虑。 3. 前向传播 (`forward`)： - 这是每个自定义层的核心函数，接收输入 `x`，对其进行处理（如矩阵乘法 `.mm()`），然后添加偏置 `self.b.expand_as(x)`，最后返回处理后的输出。 - `expand_as(x)` 方法确保了偏置与输入张量具有相同的形状，以便进行有效的矩阵运算。 4. 实例化和使用： - 通过创建 `Linear` 类的实例，如 `layer = Linear(in_features, out_features)`，我们可以创建一个具体的全连接层对象。实例化时，`in_features` 和 `out_features` 分别代表输入特征维度和输出维度。通过理解 `nn.Module` 的工作原理和如何创建自定义层，开发者可以更高效地构建复杂的神经网络结构，如多层感知机（MLP）、卷积神经网络（CNN）或循环神经网络（RNN）。此外，`torch.nn` 提供了诸如激活函数、池化层、批量归一化等功能，使得构建现代深度学习模型变得更加简单。

Pytorch|神经网络工具箱神经网络工具箱nn

哎…年前就看到了这里，我的水平和这一章之间可能隔了一个太平洋（/TДT)/

torch.nn是专门为深度学习设计的模块，核心数据结构是Module，既可以表示神经网络中的某个层，也可以表示一个包含很多层的神经网络。

4.1 nn.Module

全连接层全连接层

我们可以继承nn.Module类来写一个自己的Module，这个例子中我们写的是全连接层y=Wx+b

import torch as t

from torch import nn

from torch.autograd import Variable as V

下面这段代码定义了新的类Linear，把nn.Module放在括号中表示它是Linear的父类。这个类中有两个方法，分别是构造方法和前向传播。（没学过Python的我大概看起来废话连篇吧

TvT）

构造方法：构造方法：

init前后有双下划线，表示这是一种魔法方法，是给解释器读的，会在特殊情况下被调用。

super（Linear,self)._ _init _ _()也可以写作nn.Module. _ _init _ _(self)

必须自己定义科学系的参数，并用nn.Parameter(Variable)封装成Parameter——此后Module能够自动检测到他们，并将其作为学习参数。Parameter是一种特殊的Variable，且默认

需要求导。

关于关于

variable

：：

包含三个属性：

data

，

grad

，

grad_fn

构造函数有两个参数：

reguires_grad,volatile

前向传播：前向传播：参数就是神经网络的输入值x。

class Linear(nn.Module):

def __init__(self,in_features,out_features):

super(Linear,self).__init__()

self.w=nn.Parameter(t.randn(in_features,out_features))

self.b=nn.Parameter(t.randn(out_features))

def forward(self,x):

x=x.mm(self.w)

return x+self.b.expand_as(x)

layer是一个实例化的Linear（大概规律就是，类会首字母大写，实例化的类一般小写）。第三行可以看到，我们把继承了nn.Module的某个类实例化之后，可以直接当作函数调用，

参数是Variable形式的输入值。

另：

1.这里样本好像是竖着堆叠的。

2.输出也是Variable，书上的输出是有Variable标识的，但是jupyter notebook里似乎tensor和variable的写法没有区别。

layer=Linear(4,3)

input=V(t.randn(2,4))

output=layer(input)

output

named_parameters()和parameters是继承自nn.Module的方法，返回名字-参数组合或者参数。

for name,parameter in layer.named_parameters():

print(name,parameter)

多层感知器多层感知器

这个单隐层网络包括两个全连接层。

构造函数的参数和Linear类似，也是从第0层开始每一层的节点个数。这次构造函数中定义的不再是可学习参数，而是子Module，等号的右边则是前面定义的Linear类型的层。

class Perceptron(nn.Module):

def __init__(self,in_features,hidden_features,out_features):

nn.Module.__init__(self)

self.layer1=Linear(in_features,hidden_features)

self.layer2=Linear(hidden_features,out_features)

def forward(self,x):

x=self.layer1(x)

x=t.sigmoid(x)

return self.layer2(x)

子Module中的Parameter也可以被识别，命名规范如下：

1.Parameter直接命名，self.param_name=nn.Parameter(Variable),则名字为param.name

2.子module中的parameter，self.sub_module=SubModel(),则名字为sub_module.param_name。这其中SubModel是类所以用大写，sub_module是对象所以用小写。

perceptron=Perceptron(3,4,1)

for name,param in perceptron.named_parameters():

print(name,param.size())

nn模块中实现了绝大多数layer，继承nn.Module,封装parameter，实现forward函数（比如Linear其实在nn中是自带的），输入不是单个数据而是一个batch（即第一维）。

4.2 常用的神经网络层常用的神经网络层

4.2.1图像相关层图像相关层

卷积层卷积层

from PIL import Image

from torchvision.transforms import ToTensor,ToPILImage

to_tensor=ToTensor()

to_pil=ToPILImage()

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38716563

粉丝: 5
资源: 871

自定义Pytorch全连接层：nn.Module实践

PyTorch构建神经网络教程

PyTorch基础神经网络构建项目教程

PyTorch深度神经网络及训练入门与实践教程

陈云pytorch入门与实践代码，神经网络工具箱

MATLAB神经网络工具箱与其他深度学习框架的比较：TensorFlow与PyTorch

混合噪声的matlab代码-heymann-nn-gev-bf:Pytorch的“基于神经网络的频谱波束估计，用于声束形成”

nnAudio:使用pytorch 1D卷积网络进行音频​​处理

深度学习工具箱

pytorch-03-doc.pdf

【PyTorch工具箱】：多任务学习辅助工具与库的全面盘点

最新资源

nnAudio:使用pytorch 1D卷积网络进行音频处理