反向传播网络在手写邮政编码识别中的应用与实践

需积分: 0 38 浏览量更新于2024-08-04 收藏 1.09MB DOCX 举报

"这篇论文探讨了反向传播技术在手写邮政编码识别中的应用，强调了网络架构设计中先验知识的重要性，以及如何通过网络结构减少自由参数来提高泛化能力。作者使用反向传播算法训练单一网络，直接处理原始图像，证明了这种方法在处理大量低级信息时的有效性。实验数据来源于美国邮政的真实手写数字，经过预处理后输入到网络进行识别。" 这篇论文主要讨论了反向传播技术在复杂识别任务，特别是手写邮政编码识别中的应用。首先，它介绍了先前工作中的一个核心思想，即通过在网络结构中嵌入任务相关的先验知识，可以在不显著牺牲计算能力的情况下，降低网络的自由参数数量，从而提高泛化能力。这种策略减少了Vapnik-Chervonenkis维度（VC维），使得网络对数据的适应性更强，能更好地处理复杂和多样性的输入。论文详细阐述了所使用的数据集，包括9298个手写数字图像，这些图像来自真实邮件，涵盖了各种书写风格和质量。数据集被分为训练集和测试集，两者都包含了大量的模糊、难以辨认甚至是错误的样本，以充分测试网络的泛化性能。预处理阶段，数字图像首先被调整为统一的16×16像素大小，保持长宽比，并移除无关标记。由于线性变换，图像变为多灰度级别，而非简单的二值化，每个像素的灰度值被归一化到-1到1的范围内，以便于网络处理。在设计网络架构时，输入层直接接收预处理后的图像数据，而输出层则对应于可能的分类结果。中间层可能包括多个隐藏层，用于学习和提取图像特征。使用反向传播算法，网络能够从输入图像中自动学习特征，并逐步优化权重，以提高识别准确性。这篇论文展示了反向传播技术在解决实际世界问题时的强大能力，特别是在处理非结构化和异质性数据如手写数字识别时。这种方法的成功不仅依赖于算法本身，还依赖于合理的设计和预处理步骤，以及合适的数据集选择。这样的研究对于理解深度学习模型在现实应用中的性能和局限性具有重要意义。

反向传播技术在手写邮政编码识别中的应用

通过提供任务域的约束条件，可以极大地增强学习网络的泛化能力。这篇论文演示了

如何通过网络的架构将这些约束集成到一个反向传播网络中。该方法已成功地应用于美国

邮政提供的手写邮政编码数字的识别。、从标准化的字符图像到最终分类，由单个网络学

习整个识别操作。

1 简介：

先前关于识别简单数字图像的工作表明，通过设计一个包含了关于该任务的一定量的

先验知识的网络结构，可以对复杂任务获得很好的泛化。其基本设计原则是在不过度降低

网络计算能力的前提下，尽可能地减少网络中自由参数的数量。这一原则的应用增加了正

确泛化的可能性，因为它产生了一个熵降低的专门网络结构，降低了 Vapnik-Chervonenkis

维度(Baum and Haussler 1989)。（所以通俗的理解： VC dimension 就是某类模型对数据数

量的包容性。VC dimension 越高，就说明包容性越强。）

在这篇论文中，我们应用反向传播算法(Rumelhart et al. 1986)到一个现实世界的问题来

：识别从美国邮件中提取的手写数字。与我们小组之前在这个问题上的研究结果(Denker et

al. 1989)不同的是，学习网络是直接输入图像而不是特征向量，这证明了反向传播网络有处

理大量低级信息的能力。

2 邮政编码：

2.1 数据集

用于训练和测试网络的数据库由 9298 个分段数字组成，这些数字是流经纽约布法罗邮

局的美国邮件上手写邮政编码的数字。图 1 显示了这些图像的示例。这些数字是由不同的

人书写的，使用不同的大小、书写风格和工具，书写的谨慎程度也大不相同;7291 例用于训

练网络，2007 例用于测试泛化性能。该数据库的一个重要特征是，训练集和测试集都包含

许多不明确、不可分类甚至错误分类的示例。

下载后可阅读完整内容，剩余8页未读，立即下载

袁大岛

粉丝: 39
资源: 305

反向传播网络在手写邮政编码识别中的应用与实践

BP神经网络实现手写数字识别matlab实现_神经网络_BP神经网络_手写数字识别_数字识别_手写字体识别

BP神经网络实现手写体数字识别

mlp手写体数字识别的研究历史

python 中文手写体制作识别

手写神经网络和反向传播,彻底

基于cnn的手写中文汉字识别系统

手写数字识别 c++

手写神经网络和反向传播

反向传播神经网络的应用领域

C++和opencv 实现CNNmnist 手写数字识别的反向传播算法更新模型参数实现代码

最新资源