MNIST入门：手写数字识别与机器学习基础

需积分: 19 114 浏览量更新于2024-08-05 收藏 1.1MB DOCX 举报

"MNIST机器学习入门，包括数据集介绍、数据格式和数据内容的详细解析。" 在机器学习领域，MNIST数据集是一个非常经典且广泛使用的资源，尤其适合初学者入门。MNIST数据集专注于手写数字识别，包含了大量手写数字的图像及其对应的正确标签。这些图像都是28x28像素的灰度图片，总共分为训练集和测试集两部分。训练集由60000个样本组成，用于模型的学习和调整，而测试集包含10000个样本，用于评估模型在未见过的数据上的表现。这种数据集的划分有助于防止过拟合，并评估模型的泛化能力。 MNIST数据集的文件格式比较特殊，每个文件的开头部分包含了关于图片数量和结构的信息，接着是实际的图片数据。每个图片被展平为一个长度为784的一维向量，这是因为对于softmax回归等简单的模型，不需要保留图像的二维结构信息。因此，训练数据集的`mnist.train.images`是一个形状为[60000, 784]的张量，每个元素代表图像中对应像素的强度，取值范围在0到1之间。相应的标签数据`mnist.train.labels`是一个一维数组，其中的整数值从0到9，指示了每个图像表示的数字。在机器学习任务中，模型的目标就是学习到如何从这样的784维特征向量中正确地预测出标签。 MNIST数据集的分类问题属于监督学习，特别是多类分类。它涉及到的主要技术包括神经网络、支持向量机、决策树以及随机森林等。在实践中，人们常常使用深度学习方法，尤其是卷积神经网络（CNN），因为它们能有效捕捉图像的局部特征，对于图像识别任务表现出色。通过解决MNIST问题，初学者可以掌握基本的机器学习流程，包括数据预处理、模型构建、训练、验证和测试。同时，也能了解损失函数、优化算法（如梯度下降）以及评估指标（如准确率）等概念。解决MNIST问题不仅能够提升对机器学习的理解，也为解决更复杂的计算机视觉任务打下基础。

公式也可以结合起来

（在程序中，是

，而不是

，注意！）

：

显然，其中  是一个012向量，对于一张图片来说， 是一个

0，,)2向量，8 是每个像素点的权值，显然是一个0,)12向量，

 是一个012向量，这样实现矩阵计算。

三：实现模型构建和训练：

!"#$$!%&$ 9-$&:&5$$$

：模型构建

%() ;导入 &< &

!*%+",(-./.012# ;占位符 " %!& '，0&1,)2表示不确定张数的图，每图

,) 元素

3!*4"*$"/01.52## ;8 表示权值，这里用变量 = ，权值矩阵0,)12

4!*4"*$"/52## ; 表示偏置量，这里用变量 = ，偏置量矩阵012

之后矩阵按照上述公式构建：

!**"*".3#64# ;8 相乘得到0&12，然后加上 ，得到 ，即预测的从 

到 3 的归一化概率

：训练模型

这里使用交叉熵（%&5&"）来代替 &，公式见右边：

其中  是某张图片预测的概率分布，从之前构建的模型中运算得到，

>则是实际的正确答案，来自于标签文件（有监督学习）。这里计算所有图片的交叉熵然后相加，从而判断性能。

7!*%+",(-./.52# ;又见占位符，?表示实际的概率，来自于标签文件

7% !8*7" 79*" ## ;计算交叉熵，这里 ?和  都是0&12的矩阵，然后

求和

7%!**:;<%$"5*5#*$"7% #

;这里使用  的学习率使用梯度下降算法然后求交叉熵的最小值，?" 这里我理解成一个过程，对否？

!*$774"#;初始化所有变量

!*"# ;会话 ，构建图 @"!

*"# ;&%AB

"555#= ;循环  步

4+7.4+7 !**74+"55#;随机抓取  个数据点

*"7%.7!>=4+7. 7=4+7 ?# ;然后用这些数据点复制  和 ?，

然后训练

这里可以考虑打印每次出现的 3 和 4？

@：评估模型

7%!*A"*" .#.*" 7.##

;- 计算出某个张量对象的数据最大值的索引值。这里对比  和 ?的“值对不对，对是 ，不对是

- 

 !*7"*"7%.,(-##

;然后将布尔值转换成浮点数，之后取平均值。显然平均值就是得到的准确率

%*" .7!>=**. 7=**4?# ;赋测试值

计算准确率

：一些问题总结

程序规范不是太熟，所以很多细节不太理解，经过整理总结如下：

（）数据的输入为什么会变成 * 和 *，在哪里被规格化了？

之前的代码里肯定有转换的地方，从四个 9 生成  和 。之后再找找吧。

剩余13页未读，继续阅读

华东设计之美

粉丝: 2w+
资源: 73

MNIST入门：手写数字识别与机器学习基础

mnist数据集下载的完整代码——mnist_download_main.rar

四种机器学习算法在MNIST数据集上的对比研究.pdf

学习笔记4_学习搭建自己的网络——MNIST在caffe上进行训练与学习-薛开宇1

Python基于5种机器学习模型实现MNIST手写数字识别源码(机器学习课程作业).zip

机器学习大作业-基于5种机器学习模型实现 MNIST 手写数字识别源代码（满分项目）

基于机器学习方法的MNIST手写数字识别.zip

机器学习大作业-基于5种机器学习模型实现 MNIST 手写数字识别+源代码+文档说明.zip

使用Mnist数据集测试scikit-learn的机器学习类库_Mnist.zip

合肥工业大学 2023《机器学习》大作业-基于5种机器学习模型实现 MNIST 手写数字识别+源代码+文档说明

MNIST机器学习入门

最新资源