PyTorch图像数据集详解与翻译
100 浏览量
更新于2024-08-03
收藏 6.5MB PDF 举报
"PyTorch 自带数据集官方文档翻译及梳理总结,涵盖图像分类、对象检测、语义分割等多个领域常用数据集"
在 PyTorch 中,`torchvision.datasets` 是一个非常重要的库,它提供了许多流行的数据集,便于进行计算机视觉任务的训练和测试。以下是对这些数据集的详细说明:
1. **图像分类**:
- **EMNIST**:增强版的MNIST,包含手写数字和字母。
- **MNIST**:经典的10类手写数字数据集。
- **QMNIST**:质量更高的MNIST替代品,提供更丰富的数据。
- **USPS**:美国邮政服务的手写数字数据集。
- **SVHN**:街景数字数据集,更接近现实世界的数据。
- **KMNIST**:日语手写字符数据集。
- **Omniglot**:多种手写字符集合,用于one-shot学习。
- **FashionMNIST**:时尚商品分类数据集,作为MNIST的替代。
- **CIFAR**:CIFAR-10和CIFAR-100,分别包含10类和100类的小型彩色图像。
- **LSUN**:大规模场景理解数据集,用于图像生成任务。
- **STL-10**:小规模的图像分类数据集,用于评估模型的泛化能力。
- **ImageNet**:大规模视觉识别挑战赛的数据集,包含超过1000类的图像。
2. **人脸识别**:
- **CelebA**:包含大量名人脸部图像的数据集,用于特征提取和识别。
3. **场景分类**:
- **LSUN**:与图像分类任务类似,用于场景识别。
- **Places365**:包含365个不同场景类别的大型数据集。
4. **对象检测**:
- **SVHN**:也可用于对象检测任务。
- **VOCDetection**:PASCAL VOC数据集,包含多个类别和它们的边界框信息。
- **COCODetection**:MS COCO数据集,用于对象检测、分割和关键点检测。
5. **语义/实例分割**:
- **Cityscapes**:城市景观的语义分割数据集。
- **VOCSegmentation**:PASCAL VOC数据集的语义分割版本。
- **SBD**:语义边界数据集,用于边界检测。
6. **图像描述生成**:
- **Flickr**:Flickr8k或Flickr30k数据集,用于训练图像描述生成模型。
- **COCOCaption**:MS COCO数据集的描述部分,包含图像的多语言描述。
7. **视频分类**:
- **HMDB51**:包含51类人类动作的视频数据集。
- **Kinetics**:大规模的视频动作识别数据集。
8. **3D重建**:
- **PhotoTour**:用于图像匹配和3D重建任务。
9. **阴影检测**:
- **SBUEMNIST**:针对阴影检测的数据集。
在使用这些数据集时,通常需要设置`root`参数指定数据集的存储位置,`split`参数选择数据集的子集(如训练集或测试集),并可选地设置`download`参数自动下载数据。例如,要加载训练集的EMNIST数据集,可以这样写:
```python
import torchvision.datasets as datasets
emnist = datasets.EMNIST(root='./data', split='train', train=True, download=True)
```
这些数据集不仅用于训练模型,还可以用来验证和比较不同算法的效果,是深度学习研究和实践中的基础工具。理解每个数据集的特点和用途,有助于选择适合特定任务的数据集,从而优化模型性能。
2020-12-23 上传
2020-12-26 上传
2020-03-10 上传
2023-12-27 上传
点击了解资源详情
点击了解资源详情
zz_ll9023
- 粉丝: 1078
- 资源: 5268
最新资源
- Haskell编写的C-Minus编译器针对TM架构实现
- 水电模拟工具HydroElectric开发使用Matlab
- Vue与antd结合的后台管理系统分模块打包技术解析
- 微信小游戏开发新框架:SFramework_LayaAir
- AFO算法与GA/PSO在多式联运路径优化中的应用研究
- MapleLeaflet:Ruby中构建Leaflet.js地图的简易工具
- FontForge安装包下载指南
- 个人博客系统开发:设计、安全与管理功能解析
- SmartWiki-AmazeUI风格:自定义Markdown Wiki系统
- USB虚拟串口驱动助力刻字机高效运行
- 加拿大早期种子投资通用条款清单详解
- SSM与Layui结合的汽车租赁系统
- 探索混沌与精英引导结合的鲸鱼优化算法
- Scala教程详解:代码实例与实践操作指南
- Rails 4.0+ 资产管道集成 Handlebars.js 实例解析
- Python实现Spark计算矩阵向量的余弦相似度