PyTorch深度学习框架API速查与指南

需积分: 23 20 浏览量更新于2024-07-16 2 收藏 2MB PDF 举报

"PyTorch函数API速查表.pdf" PyTorch是一款广泛应用于深度学习领域的开源框架，尤其受到学术界的热烈追捧。它以其灵活、高效和易于使用的特性，成为研究和开发新模型的重要工具。PyTorch的核心在于其动态计算图机制，允许用户在运行时构建和修改计算图，这与某些静态计算图的框架（如TensorFlow）形成了鲜明对比。自动求导机制是PyTorch中的一个关键功能，它使得训练神经网络变得更加便捷。在PyTorch中，你可以通过设置`requires_grad=True`来跟踪某个张量的操作，以便于之后进行反向传播计算梯度。`volatile`属性用于在某些不参与训练的计算中禁用梯度追踪，以节省内存和提高效率。张量（`torch.Tensor`）是PyTorch的基础数据结构，它可以在CPU或GPU上操作。张量具有多种属性，例如形状（`shape`）、数据类型（`dtype`）和设备（`device`）。`torch.sparse`模块则提供了稀疏张量的支持，这对于处理大规模稀疏数据非常有用。 CUDA语义使得PyTorch能够利用NVIDIA的CUDA技术在GPU上加速计算。`torch.cuda`模块提供了在GPU上创建和操作张量的方法。扩展PyTorch可以通过自定义模块和操作符来实现，这通常涉及到编写C++扩展或使用`torch.utils.cpp_extension`。此外，`torch.nn`模块包含了大量预定义的神经网络层和损失函数，`torch.nn.functional`则提供了更多函数式接口的运算。优化是深度学习中的重要一环，PyTorch的`torch.optim`包包含了各种优化器，如SGD、Adam、RMSprop等，用于更新网络权重。`torch.nn.init`提供了一些初始化权重的函数，这对于网络的性能至关重要。在多进程编程方面，PyTorch的`torch.multiprocessing`包支持数据并行训练，而`torch.distributed`则提供了分布式训练的接口，可以在多台机器上协同训练大型模型。序列化语义允许用户保存和加载模型，这对于模型的持久化和继续训练非常有用。`torch.utils.data`模块则提供了数据加载和预处理的工具，如DataLoader，便于批量处理大规模数据集。 `torchvision`是PyTorch的一个扩展库，包含了常见的数据集（如CIFAR10、ImageNet）、预训练模型和图像处理变换，对于计算机视觉任务非常实用。 PyTorch的API速查表涵盖了从基础操作到高级特性的全方位指南，是开发者日常工作中不可或缺的参考资料。无论你是初学者还是经验丰富的开发者，这份文档都能帮助你更有效地理解和使用PyTorch。

从版本0.1.9开始，大量的GPU（8+）可能未被充分利用。但是，这是一个正在积

极开发中的已知问题。像往常一样，测试你的用例。

使用CUDA模型进行多线程处理(multiprocessing)存在重要的注意事项；除非准确

的满足了数据处理的要求，否则很可能您的程序将具有不正确或未定义的行为。

译者署名

用户名头像职能签名

风中劲草翻译人生总要追求点什么

CUDA语义

#InheritfromFunction

classLinear(Function):

#biasisanoptionalargument

defforward(self,input,weight,bias=None):

self.save_for_backward(input,weight,bias)

output=input.mm(weight.t())

ifbiasisnotNone:

output+=bias.unsqueeze(0).expand_as(output)

returnoutput

#Thisfunctionhasonlyasingleoutput,soitgetsonlyon

egradient

defbackward(self,grad_output):

#Thisisapatternthatisveryconvenient-atthetop

ofbackward

#unpacksaved_tensorsandinitializeallgradientsw.r.

t.inputsto

#None.ThankstothefactthatadditionaltrailingNone

sare

#ignored,thereturnstatementissimpleevenwhenthe

functionhas

#optionalinputs.

input,weight,bias=self.saved_tensors

grad_input=grad_weight=grad_bias=None

#Theseneeds_input_gradchecksareoptionalandthereo

nlyto

#improveefficiency.Ifyouwanttomakeyourcodesimp

ler,youcan

#skipthem.Returninggradientsforinputsthatdon'tr

equireitis

#notanerror.

ifself.needs_input_grad[0]:

grad_input=grad_output.mm(weight)

ifself.needs_input_grad[1]:

grad_weight=grad_output.t().mm(input)

ifbiasisnotNoneandself.needs_input_grad[2]:

grad_bias=grad_output.sum(0).squeeze(0)

returngrad_input,grad_weight,grad_bias

现在，为了更方便使用这些自定义操作，推荐使用 apply方法：

linear=LinearFunction.apply

我们下面给出一个由非变量参数进行参数化的函数的例子:

扩展PyTorch

classMulConstant(Function):

@staticmethod

defforward(ctx,tensor,constant):

#ctxisacontextobjectthatcanbeusedtostashinfo

rmation

#forbackwardcomputation

ctx.constant=constant

returntensor*constant

@staticmethod

defbackward(ctx,grad_output):

#Wereturnasmanyinputgradientsastherewereargume

nts.

#Gradientsofnon-TensorargumentstoforwardmustbeN

one.

returngrad_output*ctx.constant,None

你可能想检测你刚刚实现的 backward方法是否正确的计算了梯度。你可以使用小

的有限差分法( FiniteDifference)进行数值估计。

fromtorch.autogradimportgradcheck

#gradchecktakesatupleoftensorsasinput,checkifyourgra

dient

#evaluatedwiththesetensorsarecloseenoughtonumerical

#approximationsandreturnsTrueiftheyallverifythiscondit

ion.

input=(Variable(torch.randn(20,20).double(),requires_grad=True

),Variable(torch.randn(30,20).double(),requires_grad=True),)

test=gradcheck(Linear.apply,input,eps=1e-6,atol=1e-4)

print(test)

扩展torch.nn

nn模块包含两种接口- modules和他们的功能版本。你可以用两种方法扩展它,

但是我们建议，在扩展 layer的时候使用 modules，因为 modules保存着参

数和 buffer。如果使用无参数操作的话，那么建议使用激活函数，池化等函数。

添加操作的功能版本已经在上面的章节中已经介绍了。

增加一个 Module。

由于 nn大量使用 autograd。所以，添加一个新的Module类需要实现一

个 Function类,它会执行对应的操作并且计算梯度。我们只需要很少的代码就可

以实现上面 Linear模块的功能。现在，我们需要实现两个函数：

扩展PyTorch

剩余293页未读，继续阅读

Lnn@

粉丝: 0

PyTorch深度学习框架API速查与指南

pytorch docs v0.4.1 官方文档PDF版

PyTorch官方教程中文版.pdf

动手学深度学习pytorch.pdf

pytorch_API_docs.zip

深度学习PyTorch极简入门PDF教程.pdf

anaconda、pytorch与tensorflow安装教程 .pdf

特征预处理，变成pytorch能用的Tensor.pdf

PyTorch.docs-1.3.0.zip

【No561】深度学习PyTorch极简入门PDF教程.rar

PyPI 官网下载 | pytorch_toolbelt-0.3.0.tar.gz

最新资源