2013,49(1)
C omputer Engineering and Applications 计算机工程与应用
1 引言
脱 机 手 写 数 字 识 别 技 术 在 现 实 生 活 中 具 有 较 多 应
用。但由于数字的笔画比较简单且多变,对同一数字,不
同国家的手写规范有着很大的区别,所以到目前为止,脱
机手写数字的识别精确度还不能得到有力的保证。再加
上数字的上下文无关性,使得脱机手写识别的要求比联机
汉字识别甚至是脱机汉字识别的要求更高。
对数 字字 符图 像进 行识 别,首先 要对 图像 进行 预处
理,然后再对处理好的图像进行特征提取,最后进行特征
分类。其中特征提取和分类是最重要的一个环节。目前
常用的特征提取算法有基于统计的特征提取算法和基于
结构的特征提取算法
[1-3]
。基于统计的特征提取算法反映
了图像点阵的总体分布信息,处理简单,特征提取的效率
和精确度也比较高,对图像细节和噪声不敏感,但是对一
些精细结构不能有效提取。如何选取好统计区域也很难
确定。因此在实际应用中,尽管其识别率比较稳定,但是
如何进一步提高精度,并没有一般的解决方案。结构特征
提取是对字符图像的凹凸、交叉点、断点、弧度、轮廓等结
构特征进行提取,即提取图像中的点、脊、弧、圈等标志性
特征量,并对其进行数学分析,进一步得出图像数字的所
属类别。结构特征提取能把握数字固有的笔画结构,识别
命中率高,但是其对数字结构的变动较为敏感,由于噪声
和书写风格的敏感性,对于不同的手写字形不能给出较满
意的分离效果。因此该算法的稳定性比较低,受环境影响
比较大,且通常运算复杂度都很高
[4]
。
目前 常用 的识 别方 法有 贝叶 斯算 法、基于 图论 的算
法、支持向量机、人工神经网络、多分类器组合等
[5-13]
。由于
传统特征提取算法比较单一,一旦对某个数字的某类特征
提取失败,将会得到错误的分类结果。文献[6]和文献[9]采
用多种特征融合的方式来提高识别的精度;文献[13]基于
DNN 神经网络,提出了一个传统的线性判别分析特征提取
的泛化方法。传统的线性判别分析方法的优点在于通过
类别个数使得特征空间的本征维度是有界的,同时使得最
优的判别函数是线性的。但其不足在于从任意分布的原
基于双射变换的脱机手写数字识别方法
王 鑫,章浩泽,王朝晖,刘纯平
WAN G Xin, ZHANG Haoze, WANG Zhaohui, LIU Chunping
苏州大学 计算机科学与技术学院,江苏 苏州 215006
C ollege of Computer Scie nce and Technology, Soochow Univers ity, Suzhou, Jiangsu 215006, China
WANG Xin, ZH ANG Haoze, WANG Z haohui, et al. Of f-line handwritten digital recognition using bijective mapping
functions. Computer Engineering and Applications, 2013, 49(1):227-230.
Abs tract:Aiming at the low accuracy, stability and hit rate of classi c feature extraction for handwrit ten dig it recognition, a
method of feature extraction and classification based on outline architectura l feature is propo sed. This method repeatedly extracts
the outline features o f a digit which is converted by some bijective mapping functions, c ombines t he results together by using BP
networks , and gets the result thro ugh statistical analysis. This f eature ext raction and classific ation meth is simple and less time
consumed. The experimental results show that this method can improve the hit rate and efficiency of handwritten digit recognition.
Key words:bijective mapping; architectural feature; handwritten digit recognition; Back Propagation(BP)Neural Network
摘 要:针对传统特征提取和分类方法速度慢、稳定性差、识别率低等特点,提出了一种基于外围结构特征提取的手写数
字识别方法。该方法多次少量地提取经过双射变换后的图像外围结构特征,对每一次提取的特征结合 BP 神经网络生成
相应的分类器,对不同特征的分类结果进行融合得出手写数字的识别结果。实验结果表明,该特征提取方法实现简单,运
算量小,大大提高了脱机手写数字的识别率和效率。
关键词:双射变换;结构特征;手写数字识别;反向传播神经网络
文献标志码:A 中图分类号:TP3 91.41 doi:10.3778/j.issn.1002-8331.1206-0288
基金项目:国家自然科学基金(No.61170124,No.61272258)。
作者简介:王鑫(1 989—),男,研究方向为图像处理与分析;章浩泽(1991—),男,研究方向为图像处理与分析;王朝晖,女,副教授,研究
方向为图像处理和分析;刘纯平(1971—),通讯作者,女,博士,副教授,研究方向为图像处理、模式识别、计算机视觉。
E-mail:cpliu@suda.edu.cn
收稿日期:2012-06-18 修回日期:2012-10-11 文章编号:1002-8331(2013)01-0227-04
227