维吾尔文图像倾斜校正新方法:提高字母切分准确率

0 下载量 4 浏览量 更新于2024-08-26 收藏 514KB PDF 举报
本文主要探讨了一种改进的维吾尔文图像倾斜校正方法,针对维吾尔文扫描过程中文档常见的倾斜问题,传统的校正方法往往只能提供初步的处理,这可能会对后续的文字切分和识别过程造成影响。作者提出了结合基于凸多边形的最小面积外接矩形法和基线拟合技术的综合解决方案。 首先,通过最小面积外接矩形法,这种方法利用凸多边形的概念,寻找图像中文字区域的最大边界矩形,以此进行初步的倾斜校正,有助于减少图像中的倾斜角度偏差。这个步骤对于全局校正起到了关键作用,为后续的精细化处理奠定了基础。 接着,作者进一步细化了校正过程,针对每一行文本,采用基线拟合方法。基线拟合是一种根据文本行中字符的上下边缘来确定其基准线的技术,通过对单行文本的独立校正,确保了每个字符的准确性和行内结构的完整性,这对于维吾尔文这种有独特字符形状和复杂布局的语言尤为重要。 最后,校正过的文本行被整合到一起,形成完整的文档。这种逐行校正的策略确保了整个文档的倾斜校正效果更为精确,提高了字母切分的准确性。经过实验验证,这种改进方法相较于现有方法,平均提高了约5%的字母切分准确率,最高提升达到7%,这在实际应用中具有显著的优势。 这项研究不仅解决了维吾尔文图像倾斜校正的问题,还优化了后续处理流程,为维吾尔文文档的数字化处理和自然语言处理任务提供了更为精准的基础。通过这种方式,研究人员能够更有效地提取和分析维吾尔语文档的信息,对于维吾尔语文献的数字化存储和传播具有重要意义。