手写维吾尔文本行倾斜校正：核心区域与最小二乘法

59 浏览量更新于2024-08-28 收藏 1.85MB PDF 举报

"基于核心区域检测的手写维吾尔文本行倾斜校正方法" 手写维吾尔文本图像的可读性和识别精度对于自动识别系统至关重要。传统的倾斜校正方法，如Hough变换，存在手动设置参数和计算量大的问题。为解决这些问题，该研究提出了一种基于核心区域检测的新方法，旨在优化手写维吾尔文本行的倾斜校正过程。首先，文章介绍了采用大津算法来计算图像的阈值，这是一种常用的图像分割方法，能够自动确定图像的背景和前景，从而有效地提取出文本行的核心区域。通过这个步骤，可以识别出文本的主要部分，为后续的分析提供基础。接着，研究应用了最小二乘拟合技术来确定文本行的下基线。下基线是文本行的重要特征，对于校正倾斜至关重要。最小二乘法是一种优化算法，用于找到最佳拟合线或曲线，使所有数据点到该拟合线的残差平方和最小，因此它能准确地描绘出文本行的底部轮廓。在确定了核心区域和下基线后，论文提出了一个策略，即针对每个可能的倾斜角度（在合理的间隔范围内），应用旋转算法来校正图像的倾斜。这种方法允许系统逐步调整图像的角度，直到找到最接近水平的校正角度，从而减少文本行的倾斜。实验结果显示，这种基于核心区域检测的倾斜校正方法在手写维吾尔文本行上取得了显著的效果，首次将这种方法应用于这一特定领域。这种方法的创新性和有效性在于它减少了手动参数设置的依赖，并通过优化的算法提高了校正的效率和准确性。该研究由国家自然科学基金资助，由摆雪刚、艾斯卡尔·艾木都拉和卡米力·木依丁共同完成。他们分别在手写文本图像问题、智能信息处理和图像处理方面有着深入的研究。论文的发表，为手写维吾尔文本图像的预处理提供了新的思路，对于提升自动识别系统的性能具有积极意义。关键词：自动识别，核心区域，基线确定，倾斜校正中图分类号：TN911 文献标识码：A DOI编码：10.14016/j.cnki.jgzz.2015.03.047 Detecting Core Region Based Handwritten Uygur Text Line Skew Correction Algorithm 该研究不仅贡献了一种新的倾斜校正技术，还为手写文本图像处理领域的研究者提供了有价值的参考，推动了维吾尔语自动识别技术的进步。