使用卷积神经网络进行准确、数据高效、无约束的文本识别
无约束文本识别是一项重要的计算机视觉任务,具有多种不同的子任务,每个子任务都有自己的挑战。 深度神经网络的最大承诺之一是从输入的原始信号中提取特征的收敛和自动化,从而以最少的领域知识实现最高的性能。 为此,我们提出了一种数据高效的端到端神经网络模型,用于通用、无约束的文本识别。 在我们提出的架构中,我们在不牺牲识别准确性的情况下力求简单和高效。 我们提出的架构是一个完全卷积的网络,没有使用 CTC 损失函数训练的任何循环连接。 因此,它对任意输入大小进行操作,并以非常有效和可并行化的方式生成任意长度的字符串。 我们通过在七个公共基准数据集上实现最先进的结果来展示我们提出的文本识别架构的普遍性和优越性,涵盖广泛的文本识别任务,即:手写识别、验证码识别、OCR、车牌识别和场景 文本识别。 我们提出的架构赢得了 ICFHR2018 READ 数据集上的自动文本识别竞赛。 索引词——文本识别、光学字符识别、手写识别、验证码求解、车牌识别、卷积神经网络、深度学习。