维吾尔文扫描页倾斜校正技术

0 下载量 67 浏览量 更新于2024-08-27 收藏 1.12MB PDF 举报
"维吾尔文扫描页的倾斜校正" 这篇研究论文主要关注的是如何对维吾尔文扫描页面进行倾斜校正,以便于后续的图像切分和字符识别工作。作者提出了一种结合基于凸多边形的最小面积外接矩形法和基线拟合法的图像处理方法。 首先,论文介绍了在图像处理中,倾斜校正是一个重要的预处理步骤,特别是对于文字图像来说,因为不正确的倾斜可能会影响后续的文字检测和识别。对于维吾尔文这种沿基线书写的文字,校正倾斜更为关键,因为它有助于保持文字结构的完整性。 在技术细节上,该方法首先通过边缘检测算法提取文本区域的边缘像素,进而生成文本区域的凸多边形。接着,利用这个凸多边形,计算其最小面积外接矩形。最小面积外接矩形法是一种常见的几何形状校正方法,可以有效地估计图像的主要方向,从而进行初步的倾斜校正。 然而,仅依赖最小面积外接矩形的校正可能不够精确,因此论文引入了基线拟合的概念。在图像细化后,即去除不必要的细节并突出文本线条,通过拟合这些细化后的线条(假设它们大致平行于基线)来更精确地确定文本的实际倾斜角度。基线拟合方法能够更好地适应维吾尔文文字沿基线排列的特点,提高校正的精度。 实验结果证实了这种方法的有效性,能准确检测出文本图像的倾斜角度,并对其进行精确校正。论文指出,这种结合两种方法的策略对于维吾尔文扫描页的预处理具有显著的优势,为后续的文字分割和识别提供了坚实的基础。 关键词包括:维文、倾斜校正、预处理、外接矩形、细化和基线拟合。这篇论文被归类在计算机科学和技术的图像处理领域,具有一定的学术价值,特别是对于涉及多语言信息处理和模式识别的研究人员。 文章发表在了《信息技术》期刊,具有一定的学术影响力,其DOI(数字对象标识符)为:10.3969/j.issn.1001-3695.2013.05.070,表明这是一项经过同行评审的研究成果。作者团队来自新疆大学信息科学与工程学院的多语种信息技术重点实验室,他们在模式识别和新疆少数民族信息处理技术方面有深入的研究。