torchvision.datasets用法
时间: 2023-09-12 11:06:07 浏览: 147
torchvision.datasets是PyTorch中用于加载和处理各种标准数据集的模块。它包括了许多广泛使用的数据集,例如MNIST、CIFAR10、CIFAR100、ImageNet等。
使用torchvision.datasets可以轻松地加载这些标准数据集并将其转换为PyTorch的张量。以下是一个简单的例子:
```python
import torchvision.datasets as datasets
import torchvision.transforms as transforms
# 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data', train=True, transform=transforms.ToTensor(), download=True)
test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor(), download=True)
# 获取一个样本
image, label = train_dataset[0]
```
在这个例子中,我们使用MNIST数据集。我们首先定义了一个train_dataset和test_dataset,它们分别代表训练集和测试集。我们还定义了一个transforms,它将数据集中的图像转换为PyTorch张量。我们还指定了数据集的根目录(root)和是否下载数据集(download)。
在数据集被加载后,我们可以像使用Python列表那样访问数据集。例如,train_dataset[0]将返回第一个样本的图像和标签。
除了MNIST之外,还有许多其他的数据集可供使用。要加载其他数据集,只需将datasets.MNIST替换为其他数据集的名称即可。
阅读全文