没有合适的资源?快使用搜索试试~ 我知道了~
可在www.sciencedirect.com上在线ScienceDirect电气系统与信息技术学报2(2015)207一种基于神经网络的多字体印刷体英文字符Najmeh SamadianiAbdullah, Hamid HassanpourShahrood大学,计算机工程和信息技术系,Daneshgah街,Shahrood,伊朗2015年6月30日在线发布摘要本文提出了一种识别不同字体英文字符的方法。该方法基于神经网络,具有较强的抗字体变异能力。当新字体中的样本被添加到数据库中时,现有方法的准确性迅速下降,并且它们不抵抗字体变体,但对所提出的方法的准确性几乎保持不变并且没有太大下降。采用相似性度量神经网络进行字符识别,相似性度量将字符的特征与训练阶段获得的A到Z的字符相关指标的特征进行在SOM神经网络中,我们使用相似性度量代替距离度量,因为一个人学习字体无关,识字的人可以在不知道手写笔记字体的情况下阅读事实上,他/她在他/她的脑海中测量新字体的音符和学习的音符之间的相似性因此,我们使用两个样本来训练网络,作为所有字体的代表,例如人们心目中的默认音符我们可以获得98.56%的准确率识别一个数据库,其中包括24种不同的字体在11种不同的大小。©2015 作 者 。 ElsevierB.V. 制 作 和 托 管 这 是 CCBY-NC-ND 许 可 证 下 的 开 放 获 取 文 章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:字符识别;相似性度量;特征提取; SOM神经网络1. 介绍光学字符识别(OCR)一直是许多学者的活跃研究领域,因为该技术广泛应用于汽车牌照识别、条形码识别、邮政信件自动分拣等许多应用领域(Yang等人, 2011年)。 OCR用于识别印刷体和手写体字母,并且已经提出了许多研究以使识别具有更高的性能和更快的方式。有一些常用的方法来识别印刷体和手写体字符。Rahman和Fairhurst(1998)利用多专家分类为印刷数据的处理提供了新的方法四个著名的手写字符识别算法(二进制加权方案(BWS),频率加权方案(FWS),基于矩的模式分类器(MPC),多层感知器和反向传播(MLP))被用于识别特定的数据库包含有限的字体和印刷体字符的准确率达到97.16%。了一种系统*通讯作者。联系电话:+98 9151871285。电子邮件地址:najmeh sam@yahoo.com(N. Samadiani)。电子研究所(ERI)负责同行评审http://dx.doi.org/10.1016/j.jesit.2015.06.0032314-7172/© 2015作者。Elsevier B. V.制作和托管这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。208N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207×提出了识别和识别的手写和打字文本从文档图像使用隐马尔可夫模型(HALGOT)由怀谷等人。(2011年)。 结果表明,从HMM的上下文约束显着提高识别性能比传统的高斯混合模型(GMM)为基础的方法。然后,使用类型识别来独立地估计HMM OCR系统针对每种类型的特征序列的帧采样率和帧宽度。这种计算帧采样率和帧宽度的依赖于类型的方法在OCR精度上比独立于类型的方法有显著的提高 Sukhija等人(2013)提出了一种使用形态学操作的手写和印刷识别系统。提取一组突出的结构特征以精确地区分一个字符与另一个字符分类过程使用决策树分类器,其中在每个节点处通过一些形态学操作来定义决策规则,直到完成最终实现。决策树已根据分类算法进行了性能优化所获得的结果是显着的,系统的准确性是平均95%的手写文本和打印文本在一个字体,它达到了99%的准确性。Kae等人提出了一种迭代上下文建模的形式,它直接从试图识别的文档中学习字符模型。(2011年)。 这些学习的模型用于分割字符并在增量迭代过程中识别它们。结果表明,在识别一个占主导地位的字体的英文文档的准确率为98.1%该迭代过程的速度约为8印刷文本不限于一种字体,文本中有许多变体字体。在这些情况下,很难识别相似的字符,因为每个字体都有独特的形状。因此,它需要一个OCR系统,能够识别多种字体的印刷字符。为了解决这个问题并识别多字体字符,已经针对不同的语言进行了一些研究。Slimane等人(2011年)提出了一个多字体和多大小的阿拉伯语识别系统。该系统基于隐马尔可夫模型工具包(HTK)和伯努利混合概率函数(BernoulliHundreds,BHundreds),即用伯努利混合概率函数代替传统的高斯混合密度函数的Hundreds。几项测试评估了APTI数据库的准确性。呈现给系统的测试图像是使用大小为6、8、12、18和24的字体呈现的图像;实现了98.3%的准确度。通过对5种字体的测试,准确率下降了10Hangarge Mallikarjun和Dhandra(2010)提出了一种系统,用于开发一种算法,用于使用修改的不变矩识别机器打印的不同字体大小和样式的孤立卡纳达语元音和数字,并且它们在旋转,缩放和平移方面是不变的。采用最小距离最近邻分类器进行分类。对1800幅元音图像和1000幅数字图像进行了实验。实验结果表明,该方法对元音的识别率为97.7%,对数字的识别率为98.92%。Lakshmi等人(2009)提出了一种新的基于改进的块邻接图(BAG)结构的字符识别算法。三个流行的字体和大小的印度脚本,泰卢固语的计算性能Anteerakul(2013)提出并研究了一种分类系统的性能,该系统使用方向梯度直方图作为图像特征,支持向量机作为分类工具,以识别混合的多字体泰语-英语字符。实验是在NECTEC提供的数据集上进行的,该数据集由来自142个不同类别的单个字符的60多万个印刷图像组成,准确率可达到97%。 Ben Moussa等人(2008年)提出了手写和印刷体中阿拉伯语和拉丁语的多语言自动识别。该方法以全局纹理分析为基础,通过提取分形维数特征。建议的系统已经过测试的1000个原型与不同的三种字体类型和大小。KNN的正确判别率为96.64%,RBF的正确判别率为98.72%。Dhandra等人(2008)提出了一种基于修正不变矩的多字体英文字符识别这项工作对待孤立的英文字符被归一化为33 - 33像素的大小和图像变薄。对于尺寸和平移不变性,Palaniappan提出的修改后的不变矩进行了评估。该系统被训练和测试为7种不同的字体风格的7280图像大小为8Rani等人提出了一种多字体和多大小的系统。(2013年)。实验报告的Gabor特征的基础上的方向频率和梯度特征的基础上的梯度信息的一个单独的字符,以识别为Gurumukhi或英语。在17种字体(10-28)中进行了2431个训练集和4862个测试样本的实验尽管进行了广泛的研究,以识别字符,现有的方法有一个主要的问题,是非常敏感的字体,大小,和/或字符模式(斜体,粗体和常规)在测试阶段。特别是当我们使用现有的方法来识别不同字体的字符而不是训练样本时,这个问题因此,现有方法的训练数据库的大小太大,使得它们具有N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207209在培训阶段,每个字体和大小的代表。此外,可用字体的数量随着时间的推移而增加,以满足不同的口味。因此,现有的OCR方法不能识别新字体中的这些样本,需要改变。但如果有一个OCR系统抵抗样本字体的变化,就不会有任何失败的样本识别。本文提出了这样一个系统。本文首先对图像进行预处理,为特征提取做准备。然后,我们使用简单的方法来选择合适的特征,从字符图像。然后将提取的特征作为SOM神经网络的输入这种无监督的网络将以高精度对字符进行分类和识别我们只有两个训练样本,它不需要每个字体都有一个训练样本,所以建议的训练集很小,它提高了识别速度。Kohonen的自组织映射(SOM)是一种无监督学习算法,也是一种强大的工具,用于数据挖掘,分析,分类和可视化等许多领域(Tokunaga和Furukawa,2009)。由于使用SOM,欧几里德距离比较类的实例,但在本文中,使用相似性度量而不是使用欧几里德距离来比较输入字符的特征与各个神经元的权重之间的相似性。本文提出的方法的轮廓之一是,网络在训练阶段需要每个类中的少量样本。在训练阶段之后,系统将能够识别大小、字体和不同模式相似的字符本文的主要内容如下:第二部分介绍了数据库的第三节描述了字符识别的方法和步骤。第4节包括所提出的方法的实施结果。最后,在第5节中得出结论。2. 数据库详细信息本文使用的数据库是不同字体和大小的英文字符的二值图像该数据库包括237个字体中的每个字符的样本:为了将该方法与其他方法进行比较,我们制作了一个类似的数据库;因此,样本是从大小为10,11,12和28(情侣大小)的前17个字体中选出的。接下来7种字体的样本大小分别为16、18、20、22和24。此外,我们还在数据库中添加了15个粗体和斜体字体样本:因此,数据库样本总数为6162。图1示出了数据库中为了准备训练集,每个类别只选择了两个样本3. 方法识别或分类字符的方法有五个步骤。首先对图像进行去噪、去伪特征等预处理,进行归一化处理;其次,提取特征向量我们根据图像的中心将图像分为两部分由于图像是二进制的,所以对图像的每个部分中的每个二进制图像的行和列中的1的数量进行计数得到特征向量。如前所述第三,根据数据特征向量的特点,选择合适的相似性度量第四,使用遗传算法选择合适的特征的高维提取的特征向量和SOM网络进行训练,以确定合适的代表为每个不同的数据类别。最后,根据测试数据对网络进行了评估3.1. 预处理在形成特征向量之前,需要对输入图像进行一些预处理。在扫描字符时,噪声通常与字符相关,需要使用中值滤波器来去除噪声。去除噪声后,我们将图像顺时针旋转45°,因为它使字符与图像之间的差异更大1数据库中只有粗体的Taxion字体样本210N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207×Fig. 1.研究中使用的字体样式样本如“I”和“J”的字符然后,我们分离的字符从每个字符图像的背景中提取的最小矩形包围每个字符。由于不同字符的字体和大小不同,因此其周围矩形的大小也不相同。因此,为了规范图像大小,我们将其调整为30 -30像素,类似于Maitre(1995)。利用最近邻插值法进行了插值。该方法简单,不需要复杂的数学计算,适用于离散数据。此外,该方法比其他插值方法更快,例如线性(Kahya,2005),二次(Sablonnière,1982)和三次(Duan等人, 2000)方法(Dunlop,1980)。 图 2示出了字符A的预处理过程的示例。3.2. 特征提取特征提取是识别的关键环节,它直接影响到最终的识别效果。因此,所提取的特征必须描述每个类别的字符,并且能够表示每个字符集的唯一特征换句话说,26个字符中的每一个的不同大小和字体必须具有相似的特征向量,以便准确地执行字符分类。如第2节所述,字符的像素值为1,背景像素值为0。在该方法中,我们将图像分为两个部分在水平方向上的基础上的中心的图像。在图像的顶部,每行和每列中的1的总数按1/3和2/3的比例计算。在图像的底部,我们将其分为水平和垂直方向,并计算在图像的每个形成区域中为1 s在预处理阶段,每个字符图像以30× 30像素存储,N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207211K我我其中pri=和 qir=图二. A的打印示例,将A逆时针旋转45°,并将其矩形包围以形成特征向量。每个字符被转换为长度为165的时间序列 从印刷图案“A”的顶部和底部部分提取的特征在图1和图2中描述。 3和4所示。 图 5显示了最终提取的特征。 图 6.显示为从A到I的四种不同字体的字符样本提取的时间序列(特征向量)。图 6.显示为从A到I的四种不同字体的字符样本提取的时间序列(特征向量)。图6还示出了特征向量具有相同的长度,但是它们可能不具有相等的幅度变化。然而,对于同一字符的不同字体,局部最大值或最小值的位置在特征向量中可以不同因此,通过使用诸如欧几里德距离的距离测量,不能在不同字符之间进行准确的比较当一个类别中的字符的特征向量之间存在相似性时,有必要通过使用相似性度量来比较和分类字符(见图1)。 6)。3.3. 相似性度量为了度量两个时间序列之间的相似性,可以使用一个相似性度量有许多相似性度量,而每一个都适合于某些应用。 有关相似性度量的更多信息,请参见Hassanpour和Khalili(2011年)。在这项研究中,Jensen相似性度量用于衡量数据的特征向量之间的相似性。该测度是一个有用的工具,用于评估具有相同长度但具有不同幅度的时间序列的相似性。用于基于Jensen相似性度量在相同大小的两个向量P和Q之间进行比较的公式由(1)表示。此公式的输出值介于0和1之间。如果两个序列P和Q相同或非常相似,则Jensen函数的输出将等于0。1美元。2i=1. pr + qr2piki=1piQIki=1年q1使用Jensen相似性度量对从A到Z提取的十个时间序列的特征在十个不同的数据集中进行比较这些时间序列中的每一个都是通过对十个不同的样本取特征向量平均来获得的,而每个样本都具有各种字体和不同的状态。该评估的结果表明,Jensen测度将从一组字符中提取的特征向量视为相同的(因为该函数将导致零),并将两个不相同字符的特征向量视为不同的(它显示大于0.05的数字,因此作为阈值点)。3.4. 网络结构在这项研究中,神经网络SOM用于分类字符。 该网络具有一个输入层和一个输出层(Duan等人,2000年)。输入的数量是165,等于特征向量的长度。由于每个字符被放置在一个不同的类中,因此该网络在输出层有26个神经元。prilog2pri+qir log2qir−(pri+qir)log2(一)212N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207图3.第三章。Arial字体中的模式A:(a)提取图像顶部2/3的连续行中的1 s之和的时间序列,(b)提取图像顶部2/3的连续列中的1 s之和的时间序列,(c)提取图像顶部1/3的连续行中的1 s之和的时间序列(d)提取图像的1/3顶部的连续列中的1 s之和的时间序列,(e)从组合的时间序列a、b、c和d得到(f)提取的特征向量长度为75。突出显示的数字显示A图像中指定行和列的总和值在训练阶段,网络权重初始化为一个随机数,小于一个单位。在该网络中,与使用欧几里得距离的传统SOM网络不同,Jensen测量用于确定获胜神经元。根据SOM网络的训练原理,重复进行网络训练,并在每次迭代中更新获胜神经元的权值,以确定每个字符的最佳代表。当网络训练完成时,输出层中每个神经元的权重代表每个字符。通过在网络中应用学习样本,选择该样本中最相似的神经元权重,并在此基础上进行分类。3.5. 使用遗传算法提取的特征构成了一个高维的特征向量(165个特征),因此需要一种降维的方法。降维的一种方法是通过使用以下方法来去除维度之间的相关性,N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207213图四、Arial字体的模式A:(a,b,c,d)在图像底部的第一、第二、第三和第四连续行中提取的1 s的和的时间序列,(e,f,g,h)在图像底部的第一、第二、第三和第四连续列中提取的1 s的和的时间序列,(i)从组合的时间序列a,b,c,d,e,f,g和h得到的,(j)以长度90提取的特征向量。突出显示的数字显示A图像中指定行和列的总和值。与ICA和PCA相比,降低了分类代价。但这些方法不影响从图像中提取的特征的数量。在本文中,我们使用遗传算法来选择最好的功能,从高维特征向量。因此,我们有一个减少的特征向量和更少的特征。遗传算法是现有的最优搜索方法之一(Goldberg,1989)。该算法是一个有用的工具,选择最好的功能。 Siedlecki(1989)提出了用遗传算法选择特征。在该方法中,遗传算法用于寻找一个最佳的二进制向量,其中每一位对应于一个特征。如果214N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207图五. (a)时间序列的模式A图。图3和图4,(b)图案A的最终提取的特征向量。020406080100120140160(一)020406080100120140160(b)第(1)款020406080100120140160(c)第(1)款020406080100120140160(d)其他事项020406080100120140160(五)020406080100120140160(f)第(1)款020406080100120140160(g)020406080100120140160N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207215(h)020406080100120140160(一)见图6。提取的特征向量的时间序列的字符(a)A,(b)B,(c)C,(d)D,(e)E,(f)F,(g)G,(h)H,(i)I。在每一个这些形式的时间序列的四个不同的样本,每个字符列从上到下,在这些字体水平轴是特征的数量。216N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207=见图7。遗传算法5次迭代的最佳适应度和平均适应度值。表1两类预测的不同情景。预测类是否实际类别是真阳性假阴性无假阳性真阴性在遗传算法中,优化问题的候选解决方案的群体朝着更好的解决方案进化。每个候选解决方案都有一组属性(它的染色体或基因型),可以突变和改变;解决方案以二进制表示为0和1的字符串。进化通常从随机产生的个体的种群开始,并且是一个迭代过程,每次迭代中的种群称为一代。在每一代中,评估种群中每个个体的适应度;适应度通常是所解决的优化问题中目标函数的值从当前种群中随机选择更合适的个体,每个个体的基因组被修改(重组和可能的新一代的候选解决方案,然后在下一次迭代的算法中使用通常,算法在产生最大数量的代时终止,或者在群体达到满意的适应度水平时终止在本文中,使用该算法,我们可以得到一个特征向量的长度为80的特征向量长度为165。这种减少除了减少特征向量,提高了识别准确率从98.43%到98.56%。所使用的目标函数是识别精度,并且二进制的20个染色体在每次迭代中,选择适应度最好的4个染色体进行变异和交叉,形成下一代。图7示出了遗传算法的20次迭代中的最佳适应度和平均适应度的值。4. 结果为了引入准确性和其他性能度量的度量,应该注意的是,四个预测可以假设具有两个类别的是和否的集合(参见表1)。真阳性(TP)和真阴性(TN)是正确的分类。假阳性(FP)是指一个真正阴性的样本被预测为阳性。此外,当阳性样本被预测为阴性时,会发生假阴性(FN)因此,准确率或总体成功率是人群中真实结果(TP和TN)的比例(2)。对于学习者的评价,还使用了其他参数,如精度,召回率和F-测量(Dunlop,1980)。 回忆参数显示学习者正确预测的积极类的比例(3)。精确度或阳性预测值定义为真阳性与所有阳性结果(真阳性和假阳性)的比例(4)。 F-Measure考虑了测试的精确度和召回率,并且是它们的调和平均值(5)。(6)中的总F-度量是群体中每个类别的F-度量与真阳性的乘积的比例之和。ACTP+TNTP+TN+FP+FN(二)N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207217= ×=×表2所提出的方法与其他方法的比较。机建议的方法80 17个SOM神经网络网络建议的方法80 24位SOM神经网络网络测试52列52列98.6898.56表3所提出的方法在数据库上的准确性。PRRFMPRRFMPR RFMPRR调频一10.990.99H 0.890.980.93O0.97 0.980.98V10.980.99B0.990.970.98I 0.9810.99P0.99 0.980.99W11 1C10.980.99J 10.990.99Q0.99 0.980.98X11 1D0.990.990.990.99克朗0.990.99R0.95 0.980.96Y0.980.990.99E0.970.990.98L 10.990.99S10.99美元0.99Z0.9910.99美元F111M 0.990.900.94不0.99 10.99G0.980.990.98N 10.940.97U0.96 10.98TPR=TP+FN(3)TPPR=TP+FP(4)FM2PR×RPR+R(五)TFMTP(FM)n是所有数据(6)n两个测试进行评估所提出的方法的性能 在第一个实验中,我们通过与之相似的数据库将所提出的方法与另一种方法进行了比较。该数据库包括第2节中介绍的17种字体和11种大小的二进制样本。表2显示了所提出的方法与其他方法之间的比较。该方法具有较高的精度。我们添加了更多字体的样本来做第二个实验。在这个实验中,样本是24种字体,粗体和斜体。通过应用所提出的方法,在引入的数据库中的字符如表2所示,当我们在更多字体中添加样本时,准确度并没有下降太多;它强调了所提出的方法对字体数量的变化具有抵抗力;因为通过将更多字体中的样本添加到数据库中,准确度保持不变,并且不会像其他OCR方法那样迅速下降。因此,我们可以相信,即使字体的数量增加到24个以上,所提出的方法也会成功地识别此外,当字体数量增加时,训练样本的数量并没有改变,这意味着我们不需要在新的字体中添加新的样本到训练集中,并且所提出的方法可以根据以前的训练样本来识别字符。然而,其他方法在将具有新字体的样本添加到其数据库时必须将新字体的样本添加到训练集。如表2所示,与其他方法相比,所提出的方法具有训练样本数量少、抗字体变体、抗字符模式、分类方法简单和精度高的优点。表3示出了基于公式(3、4和5)的所提出的方法的性能表3中PR的值为1表明所提出的方法已真正分类的字符;然而,PR的其他值说明哪些字符数量的特征数量的字体抵抗字符模式(粗体,斜体)分类方法训练和测试样本准确度(%)Rani等人(二零一三年)18917×支持向量机2431列96.47Rani等人(二零一三年)20017×支持向量2431列车98.08218N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207表4建议方法对每个数字的准确度。准确度(%)准确度(%)准确度(%)准确度(%)一99H98.31O98V98B97.47我100P98W100C98.31J99Q98X100D99.16K99R98Y99.57E99L99S99Z100F100M90不100G99.16N94.09U100被选错了角色M和H特征向量之间的相似性使得在这两个类别中分类错误。这表明需要更准确的特征来区分这些相似的字符。表4显示了每个字符分类的准确性。为了更准确地评价所提出的方法,在实验中分类数据的AC和TFM值分别为98.56%和0.97%5. 结论本研究的目的是提出一种能够识别不同字体的字符的方法该方法可以识别字符的98.56%的准确率,通过使用一个简单的神经网络,而不需要使用大量的训练数据库。在该方法中,数据首先在预处理步骤中进行旋转和归一化。然后,将图像在水平方向上分为两部分,通过对每一部分图像行和列方向上的数据进行搅拌来提取特征。这些特征对于一个字符来说是相似的,即使是不同的字体。本文采用SOM神经网络对字符进行识别和分类,并在神经网络中引入一种相似性测度来识别数据的类别。实验结果表明,该方法在训练后能够以较高的准确率识别不同字体的英文字符。与文献中其他方法的比较表明,所提出的方法的优点,需要少量的训练样本,使用一个简单的分类方法,并抵抗字体的变化。引用本·穆萨,S.,Zahour,A.,Benabdelha,A.,Alimi,上午,2008.基于分形的系统,用于阿拉伯语/拉丁语,印刷体/手写体脚本识别。2008年第19届模式识别国际会议。ICPR 2008,2008年12月8日至11日,pp. 1http://dx.doi.org/Dhandra,B.V.,Mallikarjun,V.S.M.,Ravindra Hegadi,H.,2008年 基于修正的变矩的多字体英文字符识别。 J. 梳子数学。梳子。Comput. 76,153-162.Duan,Q.K.D.,Price,W.G.,Twizell,E.H.,2000. 加权有理三次样条插值及其应用。J.计算机Appl.Math.117(2),121-135。邓洛普,G.R.,1980年一种改进最近邻插值的快速计算方法。Comput. 数学 Appl. 6(3),349-353。Goldberg,D.E.,1989. 搜索、优化和机器学习中的遗传算法。艾迪森·韦斯利。Hangarge Mallikarjun,P.S.,Dhandra,B.V.,2010年。基于变矩修正的多字体/字号卡纳达文和数字识别。Int. J. Comput. Appl. (SpecialissueonRTIPPR(2)),126-130.哈桑普尔,H.A.D.,Khalili,A.,2011年。一种基于回归的离散信号相似性度量方法。 Int. J. 电子、九十八。怀古角,普拉萨德河Natarajan,P.,2011.使用隐马尔可夫模型的手写和打字文本识别。2011年国际文件分析与识别会议(ICDAR),2011年9月18日至21日,pp. 744http://dx.doi.org/Kae,A.,史密斯,D.,Learned-Miller,E.,2011.即时学习:多语言OCR的无字体方法。Int. J. Doc. Anal.认出来了。(IJDAR)14(3),289http://dx.doi.org/10.1007/s10032-011-0164-6。Kahya,E.,2005. 一种新的一维优化搜索方法:线性插值法。应用数学计算171(2),912-926。拉克希米,C.V.,辛格,S.,贾因河,巴西-地Patvardhan,C.,2009年多字体OCR应用程序的一种新的消隐方法In:Chaudhury,S.,Mitra,S.,Murthy,CA,Sastry,P.S.,帕尔,S。(编),模式识别与机器智能。计算机科学讲义,第5909卷。施普林格,柏林,海德堡,pp. 393http://dx.doi.org/10.1007/978-3-642-11164-8Maitre,G.,1995年6月OCR的Robust相似性度量实验,IDIAP TR 95-103。拉赫曼,A.F.R.,Fairhurst,M.C.,1998年机印字符识别再访:手写字符识别研究最新进展的再应用图像可见Comput. 16(12-13),819-842,http://dx.doi.org/10.1016/S0262-8856(98)00056-0.N. Samadiani,H.Hassanpour/电气系统和信息技术杂志2(2015)207219拉尼河,迪尔河Lehal,G.S.,2013年。预分段多字体字符和数字的脚本识别在:2013年第12届国际会议文件分析和识别(ICDAR),2013年8月25日 1150 http://dx.doi.org/10.1109/ICDAR.2013.233。Sablonnière,P.,1982. 三角形和正方形上的二次样条插值。Comput. Ind.3(1-2),45-52. Siedlecki,J.S.,一九八九年 大规模特征选择遗传算法的一个注记。 P模式识别Lett. 10,335-347.Shakteerakul,T.,2013.基于方向梯度直方图特征的泰文-英文混合字符分类。在:2013年第12届国际会议文件分析和识别(ICDAR),2013年8月25日至28日,pp。847 http://dx.doi.org/10.1109/ICDAR。2013.173。Slimane,F.,Kanoun,S.,阿布蒂阁下Alimi,上午,因戈尔德河,Hennebert,J.,2011. ICDAR 2011 -2011年国际文件分析与识别会议(ICDAR),9月18日至21日2011年,第页1449http://dx.doi.org/10.1109/ICDAR.2011.288。Sukhija,S.,Panwar,S.,Nain,N.,2013. CRAMM:数学形态学辅助的字符识别。2013年IEEE第二届图像信息处理国际会议(ICIIP),2013年12月9日 323 http://dx.doi.org/10.1109/ICIIP.2013.6707608。Tokunaga,K.,Furukawa,T.,2009年模块化网络SOM。神经网络 22(1),82 http://dx.doi.org/10.1016/j.neunet.2008.10.006。杨,Y.,Lijia,X.,陈春,2011年。基于特征组合的英文字符识别Procedia工程24(0),159http://dx.doi.org/
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功