手写英文字符串分割:基于识别后处理的新方法

需积分: 9 0 下载量 123 浏览量 更新于2024-08-12 收藏 863KB PDF 举报
"一种基于识别后处理的手写英文字符串分割 (2010年) - 马瑞、顾韵华、严云洋" 本文主要介绍了一种创新性的方法,用于改善手写英文字符串的分割效果,特别是针对复杂的手写文本识别问题。作者在2010年发表的研究中提出了基于识别后处理的分割技术,旨在提高手写英文字符的分割准确性。 手写英文字符串的分割是自然语言处理和光学字符识别(OCR)领域的一个挑战。传统的分割方法可能因手写体的不规则性和连笔特性而面临困难。针对这一问题,研究者采取了过分割的方式,即在初始阶段对字符图像进行过度切割,生成尽可能多的分割路径。这种方法虽然可能导致过多的子图像,但它为后续的精细化处理提供了更多的选择空间。 在过分割之后,论文中提到了“过分割验证器”的概念。这个验证器的作用是评估预分割后的子图像,判断它们是否需要进一步的合并。验证器的目的是防止因过分割导致的过度细分,同时避免丢失实际的字符边界。 为了确定哪些子图像应该被合并,研究者结合了识别器和统计语言模型。识别器能够分析子图像的形状特征,识别出潜在的字符。统计语言模型则考虑了字符间的上下文关系和语言规则,确保合并后的字符串符合英语的语法和拼写习惯。通过这种结合,可以更准确地决定哪些子图像应该组合在一起,形成完整的手写字符。 关键词涉及到“手写英文字符”、“过分割”和“语言统计模型”,强调了研究的核心元素。过分割是一种策略,用于生成可能的分割选项;语言统计模型是解决手写字符串分割问题的关键工具,它利用了语言的统计规律来优化分割决策。这篇论文的发表对提升手写英文字符识别的精确度具有重要的理论和实践意义,特别是在智能办公、文档处理和移动设备的输入法等领域。 这项工作提供了一个有效的框架,将图像处理技术与自然语言处理技术相结合,以解决手写英文字符串分割的难题。通过过分割验证和识别后处理,该方法提高了分割的准确性和鲁棒性,对手写文本识别领域的发展产生了积极影响。