PyTorch图像数据集详解与翻译

140 浏览量更新于2024-08-03 收藏 6.5MB PDF 举报

"PyTorch 自带数据集官方文档翻译及梳理总结，涵盖图像分类、对象检测、语义分割等多个领域常用数据集" 在 PyTorch 中，`torchvision.datasets` 是一个非常重要的库，它提供了许多流行的数据集，便于进行计算机视觉任务的训练和测试。以下是对这些数据集的详细说明： 1. **图像分类**： - **EMNIST**：增强版的MNIST，包含手写数字和字母。 - **MNIST**：经典的10类手写数字数据集。 - **QMNIST**：质量更高的MNIST替代品，提供更丰富的数据。 - **USPS**：美国邮政服务的手写数字数据集。 - **SVHN**：街景数字数据集，更接近现实世界的数据。 - **KMNIST**：日语手写字符数据集。 - **Omniglot**：多种手写字符集合，用于one-shot学习。 - **FashionMNIST**：时尚商品分类数据集，作为MNIST的替代。 - **CIFAR**：CIFAR-10和CIFAR-100，分别包含10类和100类的小型彩色图像。 - **LSUN**：大规模场景理解数据集，用于图像生成任务。 - **STL-10**：小规模的图像分类数据集，用于评估模型的泛化能力。 - **ImageNet**：大规模视觉识别挑战赛的数据集，包含超过1000类的图像。 2. **人脸识别**： - **CelebA**：包含大量名人脸部图像的数据集，用于特征提取和识别。 3. **场景分类**： - **LSUN**：与图像分类任务类似，用于场景识别。 - **Places365**：包含365个不同场景类别的大型数据集。 4. **对象检测**： - **SVHN**：也可用于对象检测任务。 - **VOCDetection**：PASCAL VOC数据集，包含多个类别和它们的边界框信息。 - **COCODetection**：MS COCO数据集，用于对象检测、分割和关键点检测。 5. **语义/实例分割**： - **Cityscapes**：城市景观的语义分割数据集。 - **VOCSegmentation**：PASCAL VOC数据集的语义分割版本。 - **SBD**：语义边界数据集，用于边界检测。 6. **图像描述生成**： - **Flickr**：Flickr8k或Flickr30k数据集，用于训练图像描述生成模型。 - **COCOCaption**：MS COCO数据集的描述部分，包含图像的多语言描述。 7. **视频分类**： - **HMDB51**：包含51类人类动作的视频数据集。 - **Kinetics**：大规模的视频动作识别数据集。 8. **3D重建**： - **PhotoTour**：用于图像匹配和3D重建任务。 9. **阴影检测**： - **SBUEMNIST**：针对阴影检测的数据集。在使用这些数据集时，通常需要设置`root`参数指定数据集的存储位置，`split`参数选择数据集的子集（如训练集或测试集），并可选地设置`download`参数自动下载数据。例如，要加载训练集的EMNIST数据集，可以这样写： ```python import torchvision.datasets as datasets emnist = datasets.EMNIST(root='./data', split='train', train=True, download=True) ``` 这些数据集不仅用于训练模型，还可以用来验证和比较不同算法的效果，是深度学习研究和实践中的基础工具。理解每个数据集的特点和用途，有助于选择适合特定任务的数据集，从而优化模型性能。

zz_ll9023

粉丝: 1079
资源: 5268

PyTorch图像数据集详解与翻译

PyTorch 中文文档

Pytorch中文文档.pdf

Pytorch 实现数据集自定义读取

pytorch计算数据集mean和std

pytorch测试数据集.rar

pytorch 自定义数据集加载方法

Pytorch学习记录分享9-PyTorch新闻数据集文本分类任务实战

Pytorch MNIST数据集预处理深度解析

PyTorch自定义数据集加载教程：实例解析

Pytorch自定义数据集搭建及DataLoaders使用指南

最新资源