中文手写信封地址块定位方法:85%准确率与低耗时

0 下载量 196 浏览量 更新于2024-08-13 收藏 209KB PDF 举报
本文主要探讨了中文手写信封上目的地址块的定位问题,这是在2000年由清华大学电子工程系的研究人员薛君良、丁晓青、刘长松、钱伟威针对中国日益增长的信函业务需求,特别是邮政自动化的背景下进行的一项关键工作。他们注意到,尽管邮政分拣机能识别邮政编码,但手写地址的大量信息尚未被充分利用,尤其是对于复杂的中文手写字符。 论文首先强调了准确定位中文手写地址块的重要性,这是实现手写汉字识别的基础,因为直接识别手写地址依赖于先确定地址块的位置。与西方信封中地址相对集中且间距较大的情况不同,中文手写信封的特点使得传统的候选区域划分方法难以适用,因此他们提出了非候选方法,即直接从信封图像中提取目的地址块。 预处理是定位过程的关键步骤,包括噪声滤波、直线去除等环节。噪声滤波采用形态学滤波方法来降低二值图像的噪声水平,确保后续处理的准确性。对于文本图像中的噪声,这种方法可以有效地清除无关背景干扰。 接着,通过二值图像处理技术,提取出连通域,然后使用模式分类的方法区分文本特征和非文本特征,去除非文本的连通域,将剩余部分合并成文本行。这样做的目的是减少无效信息,提高定位的精度。 实验部分,研究者使用了500个实际采集自邮政分拣机的样本,结果显示他们的方法具有较高的提取率,大约达到了85%,而且在CPU时间方面表现优秀,平均耗时仅为3.7秒。这些数据证明了该方法的有效性和效率,对于提高邮政自动化系统的性能具有重要意义。 论文的关键词包括目的地址块、邮政自动化、中文手写信封和文本行提取,其研究得到了国家自然科学基金项目和国家“八六三”高技术项目的资助。这篇论文提供了一个实用的中文手写信封地址块定位算法,对于推动邮政自动化领域中手写汉字识别技术的发展具有重要价值。