手工实现MLP神经网络：MNIST手写数字分类与优化探索

需积分: 0 19 浏览量更新于2024-08-05 收藏 626KB PDF 举报

苟琪的神经网络第一次作业报告（MG213700091）详细探讨了如何使用多层感知机（MLP）对经典的MNIST手写数字数据集进行分类。MNIST是深度学习入门的常用数据集，因其相对简单，主要目标是理解基础的神经网络结构和实现过程。作业的核心内容包括： 1. 基准线实现：苟琪首先介绍了最基础的MLP模型，即包含线性层和激活函数（如ReLU，而非sigmoid，以避免梯度消失问题）的架构。线性层的实现涉及forward函数计算输出值、backward函数用于反向传播计算梯度，以及update函数更新权重和偏置。 2. 数据处理：MNIST数据存储在ubyte文件中，需要特殊方式读取，如解析magic number、图像数量、尺寸等。苟琪还构建了自己的数据集类（Dataset）和数据加载器（Dataloader），实现了getitem、len和next等方法，以便高效地处理数据集。 3. 实验与改进：在实现了基本的MLP后，苟琪对任务中的各项改进进行了尝试，包括可能的优化和对比分析。他针对每个改进措施进行了详细的解释，展示了与基准模型的性能对比，并讨论了各自的优缺点。这份报告不仅展示了神经网络的基本构建，还涵盖了数据预处理、模型训练和优化的重要环节。通过这个项目，苟琪不仅验证了MLP的可行性，还在实践中加深了对神经网络工作原理的理解。值得注意的是，整个过程都是基于numpy库完成的，没有依赖深度学习框架，这显示了对底层算法的扎实掌握。

神经网络第一次作业报告

苟琪 MG21370009

January 13, 2022

1 作业内容

本次神经网络作业是用多层感知机实现MNIST手写数字分类，MNIST是

一个很经典的数据集，也是很多深度学习入门数据集，其本身不是很难，

因此本次作业的主要任务在于手写MLP网络和一些其它改进实现。我全

程没有使用框架，仅仅使用numpy库完成了一个小型的BP网络。经实验发

现，其在MNIST训练集上能达到99%的正确率，因此可以说明该BP网络是

能够成功运行的。其次，对于任务要求中的每一项改进，我也分别找了一

种方法与baseline进行比较（尽管有些优化是负优化）。在下面的具体实现

中，我会按照baseline的实现，各种优化及对比，优缺点，实现代码说明以

及小结等顺序进行说明。

2 baseline

对于baseline的实现，我简要挑几个值得说明的细节进行介绍，其余部

分在代码里面都有较为完整的注释。

2.1 数据读取及加载

MNIST数据集给出的数据是ubyte文件，因此需要按照它所定义的方式

进行读取，即先读取4个int字节，magic, numImages, numRows, numColumns

分别代表，magic number，图片数量，图片宽度，图片长度等。MNIST图

片大小是28*28的，然后依次读取numImages个28*28的图片像素点即可。

其次，在读取数据集后，我们可以模仿pytorch的写法，来自己实现一

个Dataset和Dataloader，其具体实现也较为简单，仅仅需要实现 getitem ，

len ， next 等方法即可。可参照我的代码。

下载后可阅读完整内容，剩余8页未读，立即下载

不能汉字字母b

粉丝: 22
资源: 291

手工实现MLP神经网络：MNIST手写数字分类与优化探索

Arcgis地形剖面图.rar

【中国房地产业协会-2024研报】2024年第三季度房地产开发企业信用状况报告.pdf

【中国银行-2024研报】美国大选结果对我国芯片产业发展的影响和应对建议.pdf

RM1135开卡工具B17A

毕业设计&课设_宿舍管理系统：计算机毕业设计项目.zip

毕业设计&课设_画手交易管理系统：Java 毕设项目.zip

跑腿平台系统 微信小程序+SSM毕业设计 源码+数据库+论文+启动教程.zip

Visual Studio 2013 Shell

【UBS-2024研报】US Equity Strategy _Earnings Brief 3Q24 November.pdf

Mentor Graphics ModelSim SE 2020.4 x64安装包

最新资源

跑腿平台系统微信小程序+SSM毕业设计源码+数据库+论文+启动教程.zip