汉字图像识别技术探索与应用

5星 · 超过95%的资源 需积分: 10 28 下载量 71 浏览量 更新于2024-08-01 1 收藏 1.8MB PDF 举报
"这篇硕士学位论文是合肥工业大学钱自拓在2005年撰写的一篇关于汉字图像识别的研究。论文主要探讨了汉字识别的关键步骤,包括特征提取、特征模型建立和汉字图像的编码以及识别算法的设计。研究中提到了两种汉字笔划特征提取的方法,一种基于数学形态学,另一种基于Gabor滤波器。此外,还建立了基于笔划特征的汉字特征模型和编码系统,并设计了一套基于冒泡排序的识别算法,以及提出了基于汉字图形轮廓特征的误差估计方法,用于构建带有反馈的汉字识别系统。关键词涵盖了汉字识别、特征提取、数学形态学、Gabor滤波器、模糊数学和冒泡排序法。" 在这篇论文中,汉字图像识别被视作计算机视觉和模式识别技术的重要应用。作者首先关注的是如何从汉字图像中准确地提取出关键的特征信息,如横、竖、撇、捺等笔划特征,这是汉字识别的关键难点。论文提出的第一种特征提取方法是利用数学形态学,通过设计新的结构元素序列细化汉字笔划,然后基于边缘检测提取笔划,有效抑制了笔划扭曲和歪斜。第二种方法则采用了Gabor滤波器,利用其在纹理图像识别中的优势,提取出不同方向的笔划信息。 接下来,论文讨论了汉字特征模型的建立,选择笔划作为基本单元,采用先结构特征后统计特征的识别策略。利用模糊数学来定义汉字的笔划形态、形式、位置和长度等特征,构建了一套创新的特征模型和编码系统。 在汉字图像的识别算法部分,论文提出采用冒泡排序算法对提取的特征进行排序,以确定其归属度,从而实现有效的识别。同时,论文还提出了一种基于汉字轮廓特征的误差估计方法,这为构建具有反馈机制的汉字识别系统奠定了基础。 这篇论文在汉字图像识别领域做出了多方面的贡献,包括提出新的特征提取技术、特征模型和编码方法,以及识别算法和误差估计策略,对于提升汉字识别的准确性和效率有着重要的理论与实践价值。