CIFAR - 10 数据集
时间: 2024-12-27 18:26:43 浏览: 4
### CIFAR-10 数据集介绍
CIFAR-10 是计算机视觉领域中常用的一个图像分类数据集,适用于深度学习和机器学习的研究工作[^1]。该数据集由 60,000 张彩色图片组成,其中训练集包含 50,000 张图片,测试集包含 10,000 张图片。每张图片尺寸为 32×32 像素,并被分为 10 类。
#### 图像类别
这十个类分别是飞机 (airplane)、汽车 (automobile)、鸟 (bird)、猫 (cat)、鹿 (deer)、狗 (dog)、蛙 (frog) 和马 (horse),以及船 (ship) 及卡车 (truck)。
### 使用方法
为了方便研究人员获取并处理此数据集,在线平台提供了多种方式来下载这些资料。对于希望迅速获得所需文件的用户来说,可以从特定链接直接下载压缩包形式的数据集 `cifar-10-python.tar.gz`[^2]。
#### 下载与解压
通过命令行工具可以轻松完成这一过程:
```bash
wget https://gitcode.com/open-source-toolkit/94ecd/repository/archive/master.zip?ref=cifar-10-python.tar.gz -O cifar-10-python.tar.gz
tar -xzvf cifar-10-python.tar.gz
```
上述脚本会自动从指定位置拉取最新版本的数据集合,并将其保存到本地磁盘上;之后再利用 tar 工具解开归档文件以便后续操作。
#### 加载数据
Python 中可以通过如下代码加载已准备好的 CIFAR-10 数据集:
```python
import pickle
import numpy as np
def unpickle(file):
with open(file, 'rb') as fo:
dict = pickle.load(fo, encoding='bytes')
return dict
data_batch_1 = unpickle('cifar-10-batches-py/data_batch_1')
images = data_batch_1[b'data']
labels = data_batch_1[b'labels']
print(f"Image shape: {np.shape(images)}")
print(f"Label length: {len(labels)}")
```
这段 Python 脚本展示了如何读取二进制格式存储的数据批次文件,并提取出里面的图像及其标签信息。
阅读全文