沙特国王大学学报：Kufic脚本手写识别的方法研究

119 浏览量更新于2024-01-18 收藏 976KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报软计算技术在古兰经库法手稿Aasim Zafar，ArshadIqbalAligarh穆斯林大学计算机科学系，Aligarh，202002 U.P.，印度K.A. Nizami古兰经研究中心，Aligarh穆斯林大学，Aligarh，202002 U.P.，印度阿提奇莱因福奥文章历史记录：收到2020年2020年3月31日修订2020年4月25日接受2020年4月30日在线提供保留字：库法体方向梯度直方图（HOG）局部二值模式（LBP）支持向量机A B S T R A C T离线阿拉伯手写识别领域的研究工作在过去几十年中呈指数增长。尽管在识别手写阿拉伯文本方面做了大量工作，但在这方面仍有许多工作要做。虽然有很多工作局限于阿拉伯语文本，本文提出了一种分类和识别阿拉伯语言的著名脚本之一，即Kufic脚本写的文本的方法。由于各种复杂性，基于字符分割的方法在识别Kufic文本时表现不佳。该系统是基于分词，并采用了直方图的方向梯度（HOG）和本地二进制模式（LBP）的特征提取技术。稍后在本文中给出的数值计算结果与以前的阿拉伯语文本识别技术之间的比较，以显示目前的工作的有效性。该方法使用多项式核SVM分类器对库法体阿拉伯语文本进行识别，识别率达到97.05%。实验结果表明，所提出的系统识别库法脚本的性能优于以前的识别系统阿拉伯语文本。©2020作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍在这个时代，手写识别已经成为一个活跃的研究领域，当涉及到阿拉伯文字所需的信息。阿拉伯文手写体识别是模式识别领域中一个新兴的关键领域，具有广泛的实际应用前景。这些实际应用的形式可以是邮政编码识别、处理不同的表格、识别不同银行签发的支票以及自动识别不同文字、手稿等文本。对阿拉伯语手写识别的良好研究将使历史阿拉伯语手稿的阅读过程自动化，预计这些手稿将超过300万（Khorsheed，2000）。这种自动识别和阅读阿拉伯语手稿的方法将大大提高*通讯作者。电子邮件地址： aasimzafar@gmail.com （ A. Zafar ）， iqbal. gmail.com（A.Iqbal）。沙特国王大学负责同行审查内容的可用性，这是时代的需要。虽然在那个时代，手稿写得整洁干净，所以看起来很容易识别它们;但是随着时间的推移，缺乏关于手稿写作风格的信息，图像退化（因为大多数手稿都是以图像形式提供的），不受欢迎的噪音导致识别这些脚本的各种挑战（Lorigo和Govindaraju，2006）。本文提出的工作介绍了一种识别以库法体书写的阿拉伯文文本的方法这种方法不考虑基线检测和字符分割，而是使用机器学习算法进行单词级虽然有很多工作存在于阿拉伯语文本识别，但这项工作作出了重大贡献，考虑到库菲克脚本。这个识别任务利用各种机器学习工具和技术来识别Kufic脚本，这在科学和技术领域仍然是一个挑战。这也将有助于了解古代文化，人民和各种其他宗教的说教，最终将利用在科学和技术的发展。我们提出了古古兰经库法手稿的阅读框架，这是人类难以阅读这些手稿。https://doi.org/10.1016/j.jksuci.2020.04.0171319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comA. Zafar，A.伊克巴尔/沙特国王大学学报30632. 相关工作在1970年，阿拉伯语OCR（光学字符阅读器）的工作开始了（Al-Badr和Mahmoud，1995），第一个工作是由作者在1975年出版的阿拉伯语OCR（Nazif，1975）。90年代末，第一个阿拉伯语OCR系统问世（Abed和Märgner，2008年）。阿拉伯语识别系统的工作已经开始三十多年了，与其他任何文字相比，研究人员似乎仍然缺乏阿拉伯语手写识别系统的有效工作（Lorigo和Govindaraju，2006; Al-Badr和Mahmoud，1995; Abed和Märgner，2008）。在（Karthick等人， 2019），作者介绍了中文和阿拉伯文文本识别的研究以及OCR中面向应用的最新研究。该系统是基于预处理和分割。他们的方法要求输入数据必须经过预处理和分割，然后才能用于特征提取。手写识别任务使用遗传算法进行。笔迹样本取自AHPD-UTM。在（Abandah等人， 2008）中，作者研究了从手写文档中提取的特征的特征提取和分类的各种技术。他们使用主成分分析（PCA）作为预处理阶段，在特征不相关的空间中转换数据。作者在（Boussellaa等人，2010年）已经引入了一种称为PRAAD的新系统。该系统主要侧重于对阿拉伯历史文字的预处理和分析。在（Sarhan和Helalat，2007）中，作者已经介绍了一种基于人工神经网络（ANN）和对所提取的特征的统计分析的系统。作者采用最小均方（LMS）来训练神经网络（ANN）。这里的工作仅限于打印阿拉伯字母。Abed和Märgner，2008年）的研究工作引入了一种系统，该系统可以识别字符，而无需显式分割它们。他们的工作采用隐马尔可夫模型（HMM）。所有这些模型主要集中在字符识别。在识别在线阿拉伯文本作者（Elanwar等人，2012）提出了一种基于HMM的两阶段分割方法。关于在线阿拉伯手写识别的各种调查是可用的，其中包括（Tagougui等人，2013）介绍了手写阿拉伯文本识别系统和技术的简要历史。Kour和Saabne，2014年）的作者提出了基于分割方法的实时识别来识别阿拉伯文字。在（Kadhm和Hassan，2015）中提到的工作提出了一种识别手写阿拉伯文本的方法。他们采用支持向量机（SVM）分类器方法来识别阿拉伯语文本。他们的方法从使用FCM的预处理阶段开始，然后特征提取特征归一化，最后完成分类和识别。在（Elleuch等人， 2016a，2016b），作者提出了一种离线阿拉伯语文本识别的新模型。这种新的模型是通过结合两个分类器，即支持向量机（SVM）和卷积神经网络（CNN）。后来辍学技术应用到所获得的模型。CNN用作特征提取器，SVM用作识别器。作者通过使用HACDB和IFN/ENIT数据库评估了他们的工作。研究人员最近的工作（Boufenar等人，2018）研究了深度卷积神经网络（DCNN）用于离线阿拉伯语文本识别。事实证明，DCNN比传统的描述符更好。作者使用两个著名的数据集OIHACDB和AHCD证明了DCNN使用迁移学习策略的适用性。他们证实，这种方法优于其他方法在这方面。在（Aouadi和Echi，2016年）中，作者提出了阿拉伯语手写的单词提取和识别Fig. 1.文本识别系统的一般方法。历史文献的文本。他们测试了突尼斯国家档案馆的一个子集和IFN-ENIT数据集。在（Hassan和Kadhm，2016）中，作者提出了一种系统阿拉伯文手写文本识别的基础上有效的他们使用词级分割，然后进行特征提取和分类。AHDB数据集用于他们的研究工作。早期的阿拉伯文字识别工作侧重于预处理，包括基本的预处理任务，如过滤，归一化，特征提取和图像分割等。现有模型的输入通常是一组扫描图像。这些扫描的图像经过预处理，以便可以增强，这反过来又简化了识别任务。预处理步骤通常还包括噪声去除、偏斜检测和相关性等。进一步的分段发生在阿拉伯文本被分成行而不是字或子字之后的字符或子字符。下一个层次是特征提取。这些提取的特征用于训练分类器，其帮助构建模型（在训练阶段期间）并且支持基于生成的模型来识别输入文本（在测试阶段期间）。下面的图1显示了识别过程的基本结构。3. 以往方法阿拉伯手写文本识别的主要困难是阿拉伯文字的草书性质。这就是为其他脚本设计的算法不能很好地与阿拉伯语脚本一起工作的原因。阿拉伯文字中字符的形状根据其在文本中的位置而有所不同。这也导致了文本翻译的困难。一些阿拉伯字符与一个、两个或三个点相关联。这些点的识别有时会带来进一步的挑战，因为这些点会被扫描图像中包含的噪声所误解。大多数阿拉伯文字都有一个封闭的循环，这也导致了阿拉伯文字识别的困难。在这方面较早使用的方法被称为显式分析方法。这也被称为基于输入脚本的分段的方法。阿拉伯文本的连接性具有挑战性，这在库法手稿中很丰富，这使得它更加困难。尽管在阿拉伯文字识别方面已经进行了大量的研究，但是基于字符的分割仍然引入了不希望的噪声，并且对字符重组提出了进一步的挑战。此外，各种分类器不能很好地与分段输入一起工作。4. Kufic手稿库法体文字的以下特点给普通阿拉伯语文本带来了额外的挑战。字母可以根据可用空间进行扩展或收缩。的结构3064A. Zafar，A.伊克巴尔/沙特国王大学学报Kufic手稿图像具有各种类型的退化，包括退化的文本区域，噪声，不均匀的背景，老化效应，不均匀的照明以及前景和背景颜色的局部变化或不均匀性等，这些使得Kufic手稿的机器解释更具挑战性（Iqbal和Zafar，2019）。这些问题使完美分割成为一项艰巨的任务，如果不是不可能的话。这构成了在识别系统的进一步阶段传播错误的基础，这可能导致系统的整体失败（Al-Helali和Mahmoud，2017）。进一步的作者探讨了各种问题，如连字、变音符号和点问题，图二. 阿拉伯文的连字。图三. 阿拉伯文文本中的重叠和无点单词。见图4。不同风格的Kufic脚本。输入样本中存在的文本和几何变化使得难以识别阿拉伯文本（Lawrence，2015）。以下是上述问题的示意图（见图1和图2）。2和3）。古兰经手稿的书写风格各不相同，即使是相同风格的信件也可能有不同的大小，如图所示。四、因此，基于固定大小或宽度的基于字符的分段不能同样应用于库法体的古兰经作品。在书法的书写风格中，将字符彼此分开是相当困难的。5. 拟议的承认制度建议的Kufic文本识别方法包括几个步骤。这些都是非常重要的，在提高文本识别的准确性。整个识别过程围绕着预处理和分割、准备数据集、特征提取和分类等几个重要步骤。这种方法涉及词级分割。步骤如下所示。算法：. Kufic_认证输入：阿拉伯文Kufic脚本输出：对应于库法体文字的阿拉伯文本步骤1：读取输入图像步骤2：进行所需的预处理和分割第三步：分词的特征提取步骤4：提取特征第5步：对于测试，图像重复步骤1步骤6：将测试图像的特征与模型中存储的步骤7：显示识别的文本8.结束图5给出了Kufic文本识别系统的示意图。此外，在识别过程中所涉及的每个步骤进行了详细描述。5.1. 预处理和分割这一步在识别Kufic脚本中的文本时非常关键预处理涉及各个阶段，提高了所提出的系统的准确性。建议的系统的输入是图五. Kufic Mandarin识别系统。A. Zafar，A.伊克巴尔/沙特国王大学学报3065××××××××××XDx¼½-101]和Dy<$640751yG库法体的原始手稿图像。在预处理阶段，将此Kufic脚本转换为灰度，然后使用阈值函数转换为二值图像这有助于在容易图像的处理在我们的方法中，使用维纳滤波器然后，梯度g¼qg2g2ð3Þ为了去除现有的噪声和自适应方法被用于阈值的目的。这在图像中引入了一些噪声，稍后使用中值滤波方法将其去除。然后将图像分割成单词级。实现预处理阶段目标的最后一步是规范化并且，梯度h1/4tan-1。gx！yð4Þ分割的图像，使得分割的图像具有相同的尺寸，从而导致更快的识别任务。在这项工作中，分割的图像已被归一化为50 - 100像素的大小。这些分割图像的大小由32 - 64像素更好的准确率，然后输入到特征提取步骤。该阶段的各个阶段如图所示。六、5.2. 特征提取Kufic文本识别中最重要的阶段是特征提取。分割的输入图像的特征是被假定为表示文本轮廓的形状的东西。5.2.1.1. 特征向量生成。从每个2 × 2细胞的块创建直方图。在细胞（8 - 8）像素，梯度幅度和方向计算。创建8 8 = 64梯度矢量然后将每个单元分割成bin，每个bin对应于梯度方向0到180度的9个bin。这将64个向量减少到9个值。5.2.1.2. 直方图归一化。在这项工作中，总共使用了3个7= 21块。每个块有4个单元格和4个直方图。因此，对于一个向量，总共有4个9= 36个仓可用最后，通过（5）归一化向量。v在图像中。这些特征可以是与形状相关的数据，表示输入图像中有两大类L2-范数：v¼qkvk2e2ð5Þ特征;一个被称为结构特征，其包含书写的直观方面，如点、端点、环等。另一个被称为统计特征，其包含在图像区域上计算的数值测量。这些包括直方图，像素密度，矩等的整体的cessess所提出的系统取决于从预处理和分割的输入图像中提取的功能。该步骤为Kufic文本识别中的分类提供了基础。为了提取特征，我们采用了HOG和LBP技术。5.2.1. 方向梯度直方图（HOG）HOG首先由Dalal和Triggs（2005）提出它是模式识别中一个非常常用的描述符HOG用于图像的特征提取以创建分类器模型。为了找到图像的梯度，Eq.（1）在x轴和y轴上都用作边缘检测掩模21 3-1使用卷积运算，我们通过（2）获得图像的x和y方向上的梯度。x方向上的梯度gx¼IωDx和y方向的梯度y<$IωDy<$2<$其中（非归一化向量）包含给定block和e是一个小的正常数。块规范化后，将创建大小为3 7的大型HOG49 =来自所有块的直方图的756个特征向量。图7示出了“Ar-Rahim”的HOG直方图，“Ar-Rahim”是来自上述手稿图像的分割单词之一，并且单词“Ar-Rahim”的HOG可视化在图7中描绘。8.第八条。图7.第一次会议。库法语单词“Ar-Rahim”的HOG直方图图六、预处理分割（a）原始图像（b）灰度和维纳滤波图像（c）自适应阈值图像（二值图像）（d）中值滤波图像和（e）字分割图像。3066A. Zafar，A.伊克巴尔/沙特国王大学学报Xp××0;x 0<≥见图8。HOG可视化库法语5.2.2. 局部二进制模式LBP算子首先由（Ojala等人，1994年）作为一个强大的纹理描述符。它已被用于许多应用中，如虹膜识别，人脸识别，和文本识别等。像线，边缘和点的对象的特征可以由一个特定的数值尺度为LBP操作器的值表示，因此，图像的对象可以被识别。通过用（6）对关于中心像素值的3 × 3邻域进行阈值化来标记像素。p-1LBPP;Rxc;ycsgp-gc26p¼0其中，● （xc，yc），图像● P是周围像素的数量● R是半径● gp是中心相邻像素的值● gc是中心像素的值，s（x）对于3 × 3环境，将有8个邻居执行二进制测试。结果存储在一个8位数组中，然后我们将其转换为十进制值。在转换为十进制时，我们从右下角开始，继续按时钟顺序添加所有值。这给出了值65，并且由于65是非均匀LBP，因此将其分配为58。所提出的系统使用非旋转不变的均匀LBP的L2归一化直方图，即整个图像中这59种可能模式的相对频率。59级编码用于将特征向量从256减少从而使得特征总数为815（HOG的756个特征和LBP的59个特征图10示出了来自上述手稿图像的分割的库法语单词“Ar-Rahim”的LBP直方图，并且“Ar-Rahim”的LBP可视化在图11中给出。十一岁6. 分类从样本图像中提取的特征被分类，使得相似的特征一起出现。有许多分类器，如ANN，K-NN，HMM，SVM等，可用于文本识别。SVM是一种非常有效的分类器。HOG和LBP特征向量的输出被连接以形成用于分类的结果特征向量（Zafar和Iqbal，2020）。SVM分类器用于创建训练类的模型。提取未知文本的特征，并将其与训练模型的特征进行比较，以识别未知文本。都可以用107个字母来描述。1;xP 0ð7Þ6.1. 支持向量机SVM是一种有监督的学习算法，它首先是在LBP方法中，主要概念是将中心像素与落在其半径为R的周围圆上的k个像素进行比较。将中心像素的值与周围像素进行比较，如果结果值大于，则将其设置为0，否则将其设置为1。在这项工作中，8个周围的像素与半径值为1。在图9中，所有8个周围像素都被阈值化用于中心像素（以绿色示出）。根据周围像素的值，它被设置为0（如果值中心像素值），否则为1（如果值中心像素值）。这产生了256个不同的组合的LBP代码为8周围的像素。256级编码在噪声区域的情况下是无效的，并且在低分辨率图像的情况下是过拟合的（Ojala等人，2002年）。非均匀LBP用于去除噪声区域中的LBP冗余非均匀LBP是具有>2个逐位转换（0？1还是1？0）。最后将256级编码转换为59级编码。在59级编码中，有58个均匀LBP，它们被分配一个唯一的索引（从0到57），还有198个非均匀LBP，它们都被分配一个索引值58。见图9。 59级-LBP提取工艺。由（Boser等人，1992年）。它主要用于回归分析和分类。SVM用于二进制线性分类，但它也可以用于非线性或多类问题（Campbell和Ying，2011）。见图10。库法语单词“Ar-Rahim”的LBP直方图。见图11。 Kufic词“Ar-Rahim”的LBP可视化。A. Zafar，A.伊克巴尔/沙特国王大学学报3067×●-6.1.1. 二元分类SVM找到适合两个类中间的决策边界或超平面SVM的目标是对训练向量X（其中x i，i = 1，2，.. . ，N），按照等式（1）分成类别C1或C2（八）、图像具有50100像素大小。在这个识别系统中，的数据集用于训练目的（880），20%用于测试（220）。使用上述两种SVM方法进行分类。使用多项式、RBF和线性内核的One-vs-One和One-vs- All的比较见表2。g x ¼ wT x0分ð8ÞOne-vs-All方法中的多项式核产生97.05的最大准确率。的图形表示其中w是支持向量矩阵，w0是偏置。6.1.2. 多类分类有两种类型的多类分类方法可与SVM解决n类问题。一对一：在这种方法中，n *（n 1）/2个分类器从n个类中生成。每个分类器属于成对类。One-vs-All：在这种方法中，从n个类中生成n个分类器。每个分类器属于一个类。有四种类型的内核函数，如表1所示。在我们的工作中，我们考虑了线性核，多项式核和径向基函数（RBF）核（Christianini和Shawe-Taylor，2000）。在所提出的系统中，对于训练纠错输出码（ECOC）多类模型，使用templateSVM（） SVM学习器模板通过templateSVM（）获得。fitcecoc（）函数在模板学习器的帮助下训练多类ECOC模型。7. 输入图像包含Kufic脚本的测试图像经过类似的阶段，即预处理，特征提取和分类。随后分类的特征与存储在模型中的特征进行比较。识别是基于输入图像属于哪个类别的决定。测试图像和识别文本的输出如图所示。12个。7.1. 实验结果及分析实验数据集有11个类别的手写库法文字图像。每个类别都有100字的图像。每个表1Kernel函数核函数方程线性核K（xi，xj）= xi.XJ多项式核K（xi，xj）=（1 + xi.xj）d实验结果也显示在图。 13岁（Hassan和Kadhm，2016）使用线性，多项式和RBF进行分类。他们在对一般阿拉伯文本应用分类算法时考虑了HOG和DCT特征在我们的工作中，我们使用HOG和LBP特征提取技术，然后应用支持向量机分类库法文本。与Hassan和Kadhm，2016年相比，我们获得了更好的结果。比较结果见表3。表2一对一和一对所有方法的识别精度。SVM方法内核识别精度一对一多项式百分之九十四点九六RBF94.20%线性百分之九十三点四四一对一多项式百分之九十七点零五RBF百分之九十六点二五线性百分之九十五径向基函数核-kxi-xjk2K（xi，xj）1/4e2r2Sigmoid Kernel K（xi，xj）= tanh（b0xi.xj+b1）图十三.一对一和一对所有方法的SVM分类核的识别精度。见图12。 (a)库法语单词（输入）（b）识别的单词（输出）。●3068A. Zafar，A.伊克巴尔/沙特国王大学学报表3我们的方法与Hassan和Kadhm（2016）的比较功能作者文本线性函数多项式RBF特征Hassan和Kadhm（2016）阿拉伯文本92.63%百分之九十六点三一百分之九十一点五HOG + DCT我们的方法库法文本百分之九十五百分之九十七点零五百分之九十六点二五HOG + LBP表4我们的方法与其他方法的比较方法特点分类准确率Chen等人（二零一零年）Gabor特征SVM分类器82.7%竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。Kazodi和Li（2013）几何特征HMM与ANN分类器百分之九十三点三Elleuch等人（2016年a、b）较少强调特征提取CNN和SVM分类器百分之九十三点四一引用Aouadi和Echi（2016年）较少强调特征提取HMM分类器87%放弃，GA， Younis，K.S.， Khedher，M.Z.， 2008. 手写阿拉伯字符Hassan andDCT and HOG Features SVM classifier96.31%Kadhm（2016）我们的方法HOG和LBP特征SVM分类器97.05%表5时间和空间的复杂性。功能总时间（秒）分配的存储器释放的存储器峰值存储器(inKb）(inKb）(inKb）菲切科克3.385123,436123,3762804predict（）0.47720020并将所得结果与其他文献的结果作了比较。比较已经完成考虑到admina-tion的参数，即，特征提取和分类技术。表4列出了各种方法与我们方法的准确率。我们的方法获得的准确率（97.05%）显示了显着的改善，比以前类似的研究。任何提出的算法的复杂性分析预测算法在其应用时消耗的空间和时间方面的有效性。任何算法的复杂度通常使用Big-O符号计算。这种复杂度可以分为空间复杂度和时间复杂度。该算法的运行时间复杂度完全依赖于SVM的时间复杂度，即O（n3）.在这里，我们在表5中显示了fitcecoc（）和predict（）方法的时间和空间复杂度。8. 结论在这项工作中，对识别库法脚本的方法较早的方法对手写阿拉伯文文本的识别进行了讨论。我们用80%的数据集进行训练，20%的数据集进行测试。使用One-vs-All方法的SVM多项式核这种高精度值归因于几个因素，如使用维纳方法进行有效的预处理，使用HOG和LBP进行特征提取，以及使用多类SVM分类器（fitcecoc）识别Kufic脚本编写的文本实验包括预处理，分割，HOG和LBP算法的特征提取和分类使用多类 SVM 分类器（ fitcecoc ）已在 MATLABR2018a上进行。结果表明，所提出的方法产生更好的结果相比，早期的方法。在未来，这项工作可能会使用更大的数据集来扩展，以识别以各种其他阿拉伯文字书写的文本。使用基于字母形式的多个分类器进行识别Proc. 第五届IASTED国际会议信号处理。模式识别pp. 128比133阿布蒂，H. Märgner，V.，2008.阿拉伯文文本识别系统-最新技术水平和未来趋势。Conf.创新INF. Technol. IIT。pp. 692-696J.，Li，X.，2013.一种有效的脱机阿拉伯手写体识别方法。Int. J. Artif.内特尔（IJAIA）4（6）.Al-Badr，B.，Mahmoud，S.A.，1995.阿拉伯文光学文本识别的调查和书目。信号处理。41（1），49-77。Al-Helali，B.M.，Mahmoud，S.A.，2017.阿拉伯语在线手写识别（AOHR）。ACM计算监视器50（3），1-35。Aouadi，N.，Echi，A.K.，2016.阿拉伯语手写文本中的单词提取和识别。国际计算机信息科学12（1），17-23. https://doi.org/10.21700/ijcis.2016.103.Boser，B.E.，Guyon，I. M.，Vapnik，V.N.，一九九二年一种最优间隔分类器的训练算法Annu.车间计算学习.理论144-152. https://doi.org//130385.130401.Boufenar角，Kerboua，A.，Batouche，M.，2018. 离线手写体阿拉伯字符识别的深度学习研究。科根系统Res. 50 ，180-195。Boussellaa，W.，Zahour，A.，Elabed，H.，Benabdelha，A.，Alimi，A.，2010. 无监督块覆盖分析用于阿拉伯古代手写文档图像的文本行分割。处理国际会议模式1，1929-1932年。坎贝尔角，Ying，Y.，2011.学习支持向量机：人工智能和机器学习综合讲座。5（1），1陈杰，曹，H.，普拉萨德河Bhardwaj，A.，Natarajan，P.，2010.用于离线阿拉伯手写识别的Gabor功能。第九届IAPR文件分析系统国际研讨会（DAS）。pp. 53比58Christianini，N.，Shawe-Taylor，J.C.，2000.支持向量机和其他基于核的学习方法介绍。剑桥大学出版社，剑桥，英国。Dalal，N.，Triggs，B.，2005年用于人体检测的定向梯度直方图IEEE计算Soc. Conf. Comput. 视觉模式1，886-893。爱尔兰共和国伊兰瓦尔Rashwan，M.，Mashali，S.，2012.基于HMM状态设计的无约束阿拉伯语在线手写体词切分。世界科学院Sci.工程技术6（4），519-527。Elleuch，M.，Maalej河，Kherallah，M.，2016年a。一种新的设计基于SVM的CNN分类器架构与离线阿拉伯语手写识别的辍学。内部会议计算Sci. 80，1712-1723.Elleuch，M.，Tagougui，N.，Kherallah，M.，2016年b。一种新的基于SVM分类器的CNN结构，用于识别阿拉伯手写体。Int. J. Intell.系统Technol.Appl.15（4），323-340。哈桑，又名，Kadhm，M.S.，2016.基于高效分割、DCT和HOG特征的阿拉伯手写文本识别。Int. J. Multimedia Ubiquit. Eng. 11（10），83-92.Iqbal，A.，Zafar，A.，2019年。离线手写古兰经文本识别：研究视角，2019年Amity 人工智能国际会议（ AICAI ）， IEEE ， pp.125-128. DOI ：10.1109/AICAI.2019.8701404.Kadhm，M.S.，哈桑，又名，2015.基于支持向量机分类器的手写体字识别。Int. J. Adv.Comput. Sci. Appl. 6（11），64-68.Karthick，K.，Ravindrakumar，K.B.，弗朗西斯河，Ilankannan，S.，2019.文本识别的步骤和OCR的最新研究;研究。《国际技术工程杂志》（IJRTE）8（1），3095-3100.ISSN：2277-3878。Khorsheed，M.S.，两千阿拉伯文手写体中单词的自动识别剑桥大学。Kour，G.，萨布内河，2014.联机手写阿拉伯文字的实时分割。在：Proc. Int. Conf. FrontHandwriting Recognition。ICFHR，pp. 417- 422 劳伦斯，A.，2015年。阿拉伯文字识别综述Int. J. 信号处理。图像处理。模式n。8（2），401-426。Lorigo，L.M.，Govindaraju，V.，2006.离线阿拉伯手写识别：一项调查。IEEE传输模式分析马赫内特尔28（5），712-724。Nazif，A.，1975.印刷体阿拉伯字符识别系统。开罗大学。Ojala，T.，Pietikainen，M.，哈伍德，D.，1994.基于kullback分布判别分类的纹理测度性能评价。A. Zafar，A.伊克巴尔/沙特国王大学学报3069内部配置模式1，582-585。https://doi.org/10.1109/ICPR.1994.576366.Ojala，T.，Pietikainen，M.，Maenpaa，T.，2002.基于局部二值模式的多分辨率灰度和旋转不变纹理分类。IEEE传输模式分析马赫内特尔24（7），971-987。Sarhan，上午，海拉拉特岛，2007.使用ANN网络和统计分析的阿拉伯字符识别。纽约理工学院Technol. 2007（3），506-510.Tagougui，N.，Kherallah，M.，Alimi，上午，2013.在线阿拉伯语手写识别：一项调查。Int. J. Doc. Anal. 认出来了。 16（3），209-226。Zafar，A.，Iqbal，A.，2020.使用KNN和SVM分类器的阿拉伯文文本机器阅读。在：第14届INDIACom会议记录，2020年第7届计算促进全球可持续发展国际会议。ISSN：0973- 7529。pp. 131比135

下载后可阅读完整内容，剩余1页未读，立即下载