深度学习：卷积神经网络与全局训练在文档识别中的突破

需积分: 47 26 浏览量更新于2024-07-19 收藏 889KB PDF 举报

"本文主要探讨了基于梯度学习在文档识别领域的应用，特别是多层神经网络与反向传播算法的结合。作者指出，经过适当架构设计的梯度学习算法能够构建出复杂的决策表面，即使在高维度模式，如手写字符识别任务中，也能实现基本预处理后的高效分类。文章重点聚焦于卷积神经网络（Convolutional Neural Networks, CNN），这种专门针对二维形状变化设计的模型，在处理手写字符识别时展现出卓越性能，超越了其他技术。文中深入分析了真实世界的文档识别系统，这些系统通常包括字段提取、分割、识别和语言建模等多个模块。作者提出了新的学习范式——图Transformer网络（Graph Transformer Networks, GTN），它允许多模块系统通过全局的梯度学习方法进行训练，以优化整体性能指标。这种方法的优势在于其全局视野和灵活性，能够在多个任务环节上协同工作。本文还详细介绍了两种在线手写识别系统，实验证明了全局训练策略的有效性，并展示了图Transformer网络在商业和个人支票阅读上的强大性能。通过将CNN字符识别器与全球训练技术相结合，该银行支票阅读系统实现了极高的准确率，并且已经商业化部署，每天处理数百万张支票。这篇文章不仅阐述了梯度学习在文档识别中的核心作用，还强调了特定模型如CNN和新学习框架GTN如何推动这一领域的发展，以及在实际应用中的成功案例。对于研究者和开发者来说，这是一篇深入理解文档识别技术及其最新进展的重要参考资料。"

剩余46页未读，继续阅读

小冬瓜1

粉丝: 0
资源: 3

深度学习：卷积神经网络与全局训练在文档识别中的突破

LeCun-98-Gradient-Based Learning Applied to Document Recognition

CCNP SWITCH 642-813 学习指南中文扫描版

DeviceNet协议第I/II部分与简介(绝对完整版)

Gradient-based learning applied to document recognition.pdf

Gradient-Based Learning Applied to Document Recognition.pdf

lenet5——Gradient-Based Learning Applied.pdf

吴恩达老师deep learning.ai课程中提到的所有论文

C语言-LeNet-5-master,c语言基础知识入门,C,C++

C语言-LeNet-5-master_lenet_lenet5_手写字符识别_机器学习

LeNet-5神经网络——C源代码

最新资源