PyTorch基础：数据类型与字符串标注

63 浏览量更新于2024-08-30 收藏 263KB PDF 举报

"PyTorch基础教程涵盖了数据类型、One-hot编码、词嵌入以及Tensor的维度操作等内容。" 在PyTorch中，理解基本数据类型是构建神经网络模型的基础。常见的数据类型包括： 1. `torch.FloatTensor`: 这是32位浮点数Tensor，通常用于大多数计算，因为它们提供了良好的精度和速度平衡。 2. `torch.DoubleTensor`: 提供64位浮点数精度，适合需要更高精度的计算。 3. `torch.IntTensor`: 存储32位整数，适用于整数运算。 4. `torch.ByteTensor`和`torch.LongTensor`: 分别存储8位（无符号）整数和64位整数，常用于索引或布尔操作。对于字符串（string）的处理，PyTorch通常采用One-hot编码。这种编码方法将每个字符串转化为一个二进制向量，例如，"猫"可以表示为[1 0]，"狗"可以表示为[0 1]。然而，这种方法没有捕捉到词汇间的语义关系，因此，更复杂的词嵌入技术如Word2Vec和GloVe被引入，它们通过学习词向量来捕获词的上下文信息和语义关联。在PyTorch中创建和操作Tensor是非常直观的。例如，`torch.randn(2,3)`会生成一个2x3的矩阵，其元素服从标准正态分布。`a.type()`可以用来检查Tensor的数据类型，`isinstance(a, torch.FloatTensor)`则用于验证变量`a`是否为`FloatTensor`类型。了解Tensor的维度（dimension）对于处理多维数据至关重要。在PyTorch中，维度可以通过`.shape`、`.size()`和`.dim()`属性来查询： - `.shape`返回一个元组，表示Tensor的尺寸，例如，`(2,3)`表示一个2行3列的矩阵。 - `.size()`与`.shape`类似，也返回尺寸，但在某些旧版本的PyTorch中，`.size()`可能是一个可调用对象而不是元组。 - `.dim()`返回Tensor的总维度数，如标量的维度为0，一维向量的维度为1，二维矩阵的维度为2。在处理深度学习中的输入时，常常需要处理不同维度的Tensor。例如，对于图像数据，一个28x28像素的图像经过拉平后，会形成一个长度为784的一维Tensor。如果处理一批这样的图像，数据形状会变为`(n, 784)`，其中`n`表示批处理的图像数量。通过`.size(dim)`，我们可以获取特定维度的大小，如`a.size(0)`会返回第一维的大小，即批处理中的图像数量。在实际操作中，`torch.FloatTensor`常用于创建具有特定形状的Tensor，如`torch.FloatTensor(2,2)`会创建一个2x2的浮点数矩阵。而`torch.randn`函数可以生成随机分布的Tensor，这对于初始化模型参数非常有用。 PyTorch的基础教程旨在帮助初学者掌握这些基本概念，以便能够有效地构建和训练神经网络模型。理解数据类型、One-hot编码、词嵌入和Tensor操作是深入学习PyTorch的关键步骤。

pytorch基础教程基础教程

基础部分基础部分

基本数据类型基本数据类型

Data type

常用的有torch.FloatTensor, torch.DoubleTensor, torch.IntTensor, torch.ByteTensor, torch.LongTensor。

如何标注如何标注string呢？呢？

在pytorch中使用One-hot（独热编码）来表示string，[0.1.0.0…]，比如：

[1 0]：猫

[0 1]：狗

但是词与词之间的相关性并没有在one-hot中显现。所以进一步要（Embedding）用编码的方法表达语言：比如使用word2vec和glove等。

import torch

a = torch.randn(2,3) #随机初始化一个两行三列的符合正态分布的矩阵

a.type()

#'torch.FloatTensor'

isinstance(a,torch.FloatTensor)

#True

维度维度dim

标量标量:Dimension 0

Loss就是典型dimension为零的标量

torch.tensor(1.3)

# 1.3是零维，但[1.3]是一维，长度为1的Tensor

a =torch.tensor(2.2)

a.shape,a.size(),a.dim()

# torch.Size([])

Dimension 1

Bias就是dimension为1的tensor

linear input就是dimension为1的tensor

torch.tensor([1.1,2.2]).shape

# torch.Size([2]) 一维

torch.FloatTensor(2) # dim=1 size=2

# tensor([4.2981e+21, 6.3828e+28])

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38559569

粉丝: 3
资源: 948

PyTorch基础：数据类型与字符串标注

深度学习与PyTorch入门实战教程-PyTorch基础教程-PyTorch进阶教程

PyTorch基础教程.pdf

【Pytorch 技术文档】Pytorch基础教程之torchserve模型部署解析

04.PyTorch基础教程(深度学习与PyTorch入门实战教程)

PyTorch基础教程：Tensor操作详解

PyTorch基础教程：构建生成对抗网络（GAN）

PyTorch基础教程：搭建卷积神经网络

pytorch基础入门教程

Pytorch入门教程

pytorch官方教程

最新资源