机器视觉教程：MNIST数据集与图像处理

需积分: 10 11 浏览量更新于2024-08-11 收藏 507KB PPTX 举报

"《机器视觉》郑东强_第5章4_常用代码模块5.17.pptx" 在机器视觉领域，处理图像数据是至关重要的步骤。本章介绍了如何加载批量数据集以及对图像进行展示，这些都是深度学习模型训练的基础。文件中的代码主要涉及了PyTorch框架，用于处理MNIST手写数字识别数据集。首先，`load_train_data`函数展示了如何使用`torch.utils.data.DataLoader`加载MNIST数据集。`DataLoader`是一个迭代器，它将数据集分批加载到内存中，便于训练神经网络模型。在这个例子中，数据集被下载到`'dataSets/mnist_data'`目录下，并通过`transform`参数进行预处理。预处理包括将图像转换为Tensor（`ToTensor()`）和归一化（`Normalize()`），这里的均值和标准差分别为0.1307和0.3081，这是MNIST数据集的标准预处理步骤。接着，`plot_image`函数用于显示灰度图片。它使用`matplotlib.pyplot`库，创建一个6个子图的布局，每个子图显示一幅图像并附上对应的标签。通过调整图像的灰度范围使其可视，`cmap='gray'`指定颜色映射为灰度，`interpolation='none'`确保无插值，保持原始像素的清晰度。另外，`imshow`函数则用于显示彩色图像，这里同样使用了`matplotlib.pyplot`。图像首先通过除以2加0.5进行反规范化，以便在0到1之间显示。`np.transpose`用于调整图像的维度顺序，使其符合matplotlib显示的要求。 `dataiter`是一个迭代器，用于获取数据加载器`trainloader`的下一个批次的图像和标签。`images, labels = dataiter.next()`获取了一个批次的图像和对应的标签。`imshow(torchvision.utils.make_grid(images))`则使用`make_grid`方法将一批图像排列成网格，便于可视化。最后，`Flatten`类是一个简单的PyTorch模块，用于将多维张量展平为一维。在神经网络中，这通常用于连接全连接层之前，将卷积层的输出转换为线性形式。在`__init__`方法中，它继承自`nn.Module`，并定义了前向传播`forward`方法，将输入张量`x`展平。这段代码涵盖了机器视觉和深度学习的基本操作，包括数据加载、预处理、图像显示以及张量操作，这些都是构建和训练机器学习模型的关键步骤。对于理解如何使用PyTorch进行图像分类任务来说，这部分内容提供了很好的实践示例。

显示彩色图片

#'#''0''

#'#'0'

#%#1

#1#1"45)<=#

'#1#1#'0

'#%'''#1$*$4$)



#1$:

#%#;1#1

剩余12页未读，继续阅读

上智了心

粉丝: 0
资源: 18

机器视觉教程：MNIST数据集与图像处理

《机器视觉》郑东强_第3章_机器视觉硬件系统.pptx

《机器视觉》郑东强_第2章_机器视觉开发环境5.13.pptx

《机器视觉》郑东强_第5章1_神经网络与tensor5.16.pptx

《机器视觉》郑东强_第5章3_经典卷积神经网络5.20.pptx

《机器视觉》郑东强_第5章2_回归与分类5.19.pptx

《机器视觉》郑东强_第6章1_经典目标检测网络5.27_2.pptx

《机器视觉》郑东强_第1章_概述5.16.pptx

《机器视觉》郑东强_第6章2_带姿态回归的目标检测网络研究.pptx

《机器视觉》郑东强 第3章 机器视觉硬件系统.pptx概述及组成

小学年级数学税率.pptx

最新资源

《机器视觉》郑东强第3章机器视觉硬件系统.pptx概述及组成