重庆大学本科生刘平 Jing 的多特征手写汉字识别算法

2星 需积分: 32 100 下载量 42 浏览量 更新于2024-07-19 23 收藏 981KB DOC 举报
本文主要探讨的是MATLAB中的文字识别程序,特别是针对手写汉字识别的一种创新算法。该毕业设计(Thesis)由重庆大学的信息与计算机科学学院数学与物理科学专业学生刘平 Jing在导师何广辉的指导下完成,发表于2007年6月。研究的核心是提出一种结合统计特征和结构特征的多特征提取汉字识别方法。 算法的关键在于将这两种不同的识别技术相结合。首先,算法在匹配判别阶段采用分类判别思想,当汉字图像输入时,不仅考虑汉字的统计特性,如笔画频率和分布,还记录汉字的结构特征,比如笔画顺序和空间布局。这种策略有助于缩小待识别汉字的范围,提高了识别效率。 在汉字粗分类之后,算法进一步利用网格划分的方法对整个汉字图像进行处理。通过将图像分解成多个网格,计算每个网格内文字像素与整个图像中文字像素的比例,这一过程提炼出更精细的特征,用于对文字图像进行更准确的细分类。这种方法显著提升了识别精度,能够在90%以上的场景下实现汉字的准确识别。 此外,设计者还特别关注了对书写不规范汉字的处理,这在实际应用中是非常重要的一个方面。可能的解决方案包括增强算法的鲁棒性,通过增加训练数据的多样性,或者设计适应不同书写习惯的特征提取和匹配模型,以减少误识率。 这篇论文提供的MATLAB文字识别程序在理论与实践上都达到了较高的水平,展示了多特征融合的优势,对于提高汉字识别的准确性和稳定性具有重要价值。对于那些从事文字识别、计算机视觉或机器学习领域的研究者和开发者来说,这篇文章提供了一个值得深入研究和借鉴的实例。