深度学习:卷积神经网络与全局训练在文档识别中的突破
需积分: 47 26 浏览量
更新于2024-07-19
收藏 889KB PDF 举报
"本文主要探讨了基于梯度学习在文档识别领域的应用,特别是多层神经网络与反向传播算法的结合。作者指出,经过适当架构设计的梯度学习算法能够构建出复杂的决策表面,即使在高维度模式,如手写字符识别任务中,也能实现基本预处理后的高效分类。文章重点聚焦于卷积神经网络(Convolutional Neural Networks, CNN),这种专门针对二维形状变化设计的模型,在处理手写字符识别时展现出卓越性能,超越了其他技术。
文中深入分析了真实世界的文档识别系统,这些系统通常包括字段提取、分割、识别和语言建模等多个模块。作者提出了新的学习范式——图Transformer网络(Graph Transformer Networks, GTN),它允许多模块系统通过全局的梯度学习方法进行训练,以优化整体性能指标。这种方法的优势在于其全局视野和灵活性,能够在多个任务环节上协同工作。
本文还详细介绍了两种在线手写识别系统,实验证明了全局训练策略的有效性,并展示了图Transformer网络在商业和个人支票阅读上的强大性能。通过将CNN字符识别器与全球训练技术相结合,该银行支票阅读系统实现了极高的准确率,并且已经商业化部署,每天处理数百万张支票。
这篇文章不仅阐述了梯度学习在文档识别中的核心作用,还强调了特定模型如CNN和新学习框架GTN如何推动这一领域的发展,以及在实际应用中的成功案例。对于研究者和开发者来说,这是一篇深入理解文档识别技术及其最新进展的重要参考资料。"
2015-06-24 上传
2023-05-24 上传
2021-04-17 上传
2020-01-18 上传
2019-01-24 上传
2021-09-10 上传
2021-09-10 上传
小冬瓜1
- 粉丝: 0
- 资源: 3
最新资源
- SSM Java项目:StudentInfo 数据管理与可视化分析
- pyedgar:Python库简化EDGAR数据交互与文档下载
- Node.js环境下wfdb文件解码与实时数据处理
- phpcms v2.2企业级网站管理系统发布
- 美团饿了么优惠券推广工具-uniapp源码
- 基于红外传感器的会议室实时占用率测量系统
- DenseNet-201预训练模型:图像分类的深度学习工具箱
- Java实现和弦移调工具:Transposer-java
- phpMyFAQ 2.5.1 Beta多国语言版:技术项目源码共享平台
- Python自动化源码实现便捷自动下单功能
- Android天气预报应用:查看多城市详细天气信息
- PHPTML类:简化HTML页面创建的PHP开源工具
- Biovec在蛋白质分析中的应用:预测、结构和可视化
- EfficientNet-b0深度学习工具箱模型在MATLAB中的应用
- 2024年河北省技能大赛数字化设计开发样题解析
- 笔记本USB加湿器:便携式设计解决方案