PyTorch图像数据集详解与翻译
140 浏览量
更新于2024-08-03
收藏 6.5MB PDF 举报
"PyTorch 自带数据集官方文档翻译及梳理总结,涵盖图像分类、对象检测、语义分割等多个领域常用数据集"
在 PyTorch 中,`torchvision.datasets` 是一个非常重要的库,它提供了许多流行的数据集,便于进行计算机视觉任务的训练和测试。以下是对这些数据集的详细说明:
1. **图像分类**:
- **EMNIST**:增强版的MNIST,包含手写数字和字母。
- **MNIST**:经典的10类手写数字数据集。
- **QMNIST**:质量更高的MNIST替代品,提供更丰富的数据。
- **USPS**:美国邮政服务的手写数字数据集。
- **SVHN**:街景数字数据集,更接近现实世界的数据。
- **KMNIST**:日语手写字符数据集。
- **Omniglot**:多种手写字符集合,用于one-shot学习。
- **FashionMNIST**:时尚商品分类数据集,作为MNIST的替代。
- **CIFAR**:CIFAR-10和CIFAR-100,分别包含10类和100类的小型彩色图像。
- **LSUN**:大规模场景理解数据集,用于图像生成任务。
- **STL-10**:小规模的图像分类数据集,用于评估模型的泛化能力。
- **ImageNet**:大规模视觉识别挑战赛的数据集,包含超过1000类的图像。
2. **人脸识别**:
- **CelebA**:包含大量名人脸部图像的数据集,用于特征提取和识别。
3. **场景分类**:
- **LSUN**:与图像分类任务类似,用于场景识别。
- **Places365**:包含365个不同场景类别的大型数据集。
4. **对象检测**:
- **SVHN**:也可用于对象检测任务。
- **VOCDetection**:PASCAL VOC数据集,包含多个类别和它们的边界框信息。
- **COCODetection**:MS COCO数据集,用于对象检测、分割和关键点检测。
5. **语义/实例分割**:
- **Cityscapes**:城市景观的语义分割数据集。
- **VOCSegmentation**:PASCAL VOC数据集的语义分割版本。
- **SBD**:语义边界数据集,用于边界检测。
6. **图像描述生成**:
- **Flickr**:Flickr8k或Flickr30k数据集,用于训练图像描述生成模型。
- **COCOCaption**:MS COCO数据集的描述部分,包含图像的多语言描述。
7. **视频分类**:
- **HMDB51**:包含51类人类动作的视频数据集。
- **Kinetics**:大规模的视频动作识别数据集。
8. **3D重建**:
- **PhotoTour**:用于图像匹配和3D重建任务。
9. **阴影检测**:
- **SBUEMNIST**:针对阴影检测的数据集。
在使用这些数据集时,通常需要设置`root`参数指定数据集的存储位置,`split`参数选择数据集的子集(如训练集或测试集),并可选地设置`download`参数自动下载数据。例如,要加载训练集的EMNIST数据集,可以这样写:
```python
import torchvision.datasets as datasets
emnist = datasets.EMNIST(root='./data', split='train', train=True, download=True)
```
这些数据集不仅用于训练模型,还可以用来验证和比较不同算法的效果,是深度学习研究和实践中的基础工具。理解每个数据集的特点和用途,有助于选择适合特定任务的数据集,从而优化模型性能。
2020-12-23 上传
2020-03-10 上传
2020-12-26 上传
2023-12-27 上传
点击了解资源详情
点击了解资源详情
zz_ll9023
- 粉丝: 1079
- 资源: 5268
最新资源
- 全国江河水系图层shp文件包下载
- 点云二值化测试数据集的详细解读
- JDiskCat:跨平台开源磁盘目录工具
- 加密FS模块:实现动态文件加密的Node.js包
- 宠物小精灵记忆配对游戏:强化你的命名记忆
- React入门教程:创建React应用与脚本使用指南
- Linux和Unix文件标记解决方案:贝岭的matlab代码
- Unity射击游戏UI套件:支持C#与多种屏幕布局
- MapboxGL Draw自定义模式:高效切割多边形方法
- C语言课程设计:计算机程序编辑语言的应用与优势
- 吴恩达课程手写实现Python优化器和网络模型
- PFT_2019项目:ft_printf测试器的新版测试规范
- MySQL数据库备份Shell脚本使用指南
- Ohbug扩展实现屏幕录像功能
- Ember CLI 插件:ember-cli-i18n-lazy-lookup 实现高效国际化
- Wireshark网络调试工具:中文支持的网口发包与分析