ISSN 1000-0054
CN 11-2223/
N
清华大学学报 (自然科学版)
J T singhua U niv (Sci & T ech),
2002 年第42 卷第1 期
2002,Vol. 42,No. 1
6/ 38
19-22
基于正交混合
Gauss
模型的脱机手写数字识别
张 睿, 丁晓青, 刘海龙
(清华大学 电子工程系,智能技术与系统国家重点实验室,北京 100084)
收稿日期:2001-01-08
基金编号:国家 “八六三”高技术项目(863-306-
ZT
03-03-1);
国家自然科 学基金资助项目(69972024)
作者简介:张睿(1971-),男 (汉 ),博士研究生。
摘 要:在基于统计方法的脱机手写数字识别中,为更加有
效地描述特征的类条件概率分布,设计出性能优良的 Bayes
分类器,采用了混合
Gauss
模型。为减少模型的参数,通常假
设各 Gauss 分量的协方差矩阵为对角阵。由于各维特征之间
统计相关,因此需要大量的
Gauss
分量才能较好地描述特征
的类条件概率分布,使得混合模型的阶数较高。为降低模型
的阶数,采用了正交混合
Gauss
模型,即先对各类别的特征
分别进行 KL 变换,再将变换后的特征用混合 Gauss 模型来
表示。其中混合
Gauss
模型的参数可以通过
EM
算法进行估
计。最后,在 NIST (N ational Institute of Standards and
Technology
)手写数字样本集上对该方法的识别性能进行了
验证。
关键词:混合
Gauss
模型;正交混合
Gauss
模型;脱机手写
数字识别;字符识别
中图分类号:T P 391. 43
文章编号:1000-0054(2002)01-0019-04 文献标识码:
A
Offline handwr itten numeral recognition
using the orthogonal Gaussian
mixture model
ZHANG Rui,DING Xia oq ing ,LIU Ha ilo ng
(State Key La boratory of Intelligent Technology an d System s,
Department of E lectronic Engineer ing ,
T sing hua U n iver sity,Beijing 100084,China)
Abstract:T he performance of the statistical approach to offline
h andw ritten numeral recognition is improved using the G aussian
mixture model (GM M )to approximate an arbitrary class conditional
probability density. For sim plificatio n, the GM M is com m only
assumed to have diagonal covariance matrixes. Statistical
corrrelation of the features of handw ritten num erals requires a large
num ber of m ixture components to obtain a g ood approximation. T o
solve this problem ,the feature vectors are first transform ed to the
space spanned by the eigenvectors of th e covariance m atrix to r educe
th e correlation am ong the elem ents. T h e GM M is then applied to the
transform ed feature vectors. T his GM M is defined as the orthogonal
G aussian mixture model (OGM M ) w hich gives a better
approximation than GMM w ith the same number of mixture
com ponents. T he OGM M parameters can be estimated by EM
algor ithm. T he algor ithm effectiveness is demonstrated by applying
it to the N IST (N ational Institute of Standards and T echnology)
database.
Key words:G aussia n m ix ture m o del;o rtho g onal G aussia n m ix ture
m o del; o ffline handw ritten num er al reco gnitio n;
character recognition
在脱机手写数字识别领域中,基于 Bayes 决策
的统计模式识别方法取得了较好的实验结果,是目
前普遍采用的方法。设计基于参数的贝叶斯分类器,
需要已知特征的先验概率
p
(
ω
i
)和类条件概率密度
p (x/ ω
i
)。手写数字特征的类条件概率密度的形式未
知,通常简单地假设近似高斯(
Gauss
)分布。据此假
设而提出的改进的二次判决模型(MQDF)在字符识
别中获得了很好的识别性能
[1]
。而事实上,手写数字
特征的分布存在着多峰和非对称等情况,难以用简
单的
Gauss
分布来有效地描述。由于混合
Gauss
模
型(OGMM)可以用多个简单 Gauss 分布的线性组
合来逼近任意的概率分布
[2,3]
,因此采用
GMM
可以
更有效地表示手写数字特征的类条件概率密度。
1 手写数字特征的形成及提取
1. 1 手写数字特征的形成
针对手写数字识别,已经提出了大量的特征形
成方法
[4]
。其中方向线素特征经过验证是最有效的
特征之一。
方向线素特征的形成方法简述如下:
1)将手写数字的二值图像进行线性规一化处
理,使图像的大小统一为 64× 64。
2)检测二值图像的边缘像素点。