没有合适的资源?快使用搜索试试~ 我知道了~
Journal of King Saud University沙特国王大学沙特国王大学学报www.ksu.edu.sawww.sciencedirect.com基于随机Hough变换的倾斜校正和基线检测新算法Abdelhak Boukharouba*Faculte'desSciencesetdelaTechnologie,De'partement接收日期:2015年7月15日;修订日期:2016年2月6日;接受日期:2016年2月11日2016年3月29日在线发布摘要提出的技术是基于阿拉伯文文档的文本行的较低基线的检测。由于较低的基线像素属于单词图像的下边缘,因此我们首先垂直定位黑色像素处的一旦使用随机化霍夫变换确定了倾斜角,就使用y截距直方图提取基线。该算法对多种语言的倾斜文档图像的文本行提取©2016沙特国王大学. Elsevier B. V.制作和托管这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍近年来,文档图像处理已成为计算机应用各个领域将纸质文件转换为电子版本,以便存储、检索、自动处理、传输等。非常重要(Yin,2001)。文档处理可以分为两个阶段:文档分析和文档理解(Tang等人,1996年)。文档分析主要包括文档的结构布局分析和文档的信息类型分析,而文档*电话:+213 777 08 32 32;传真:+213 37 20 72 68。电子邮件地址:boukharouba_abdelhak@hotmail.com。沙特国王大学负责同行审查制作和主办:Elsevier理解被定义为识别每个块的内容和含义并构造用于有效检索文档的索引结构的过程。文档分析由三个阶段组成:预处理阶段、块分割阶段和块分类阶段(Tang等人,1996年; O 'Gorman和Kasturi,1995年)。预处理阶段包括文档的数字化、噪声去除和偏斜校正,其中讨论并比较了不同的方法(Saba等人,2011年; Rehman和Saba,2011年)。在我们的工作中,我们专注于阿拉伯文文档的倾斜校正和基线检测在阿拉伯语手稿中,大多数字符在较低的基线上相互连接,因此我们的方法是基于对文档单词的较低基线的检测。基线表示文本行的主要方向,它通常是后续算法(如分割和特征提取)的先决条件使用并报告了各种基线估计技术。对于印刷品http://dx.doi.org/10.1016/j.jksuci.2016.02.0021319-1578© 2016沙特国王大学。制作和主办:Elsevier B.V.这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词文档下边缘提取;标记算法;随机霍夫变换;倾斜校正;基线检测30A. 布哈鲁巴Papandreou等人(2014)使用最小边界框面积标准组合了增强的垂直和增强的水平投影轮廓,而在Shafii和Sid-Ahmed(2015)中,通过最小化轴平行边界框的面积来检测偏斜,其中该算法是脚本和内容独立的。传统的投影方法是用于基线检测的简单解决方案(El-Hajj等人, 2005年; Parhami和Taraghi,1981年),它逐行计算黑色像素并且基线的位置由像素的最大数目指示。但在某些情况下,这种方法并不奏效,主要是对于倾斜的脚本。Al-Rashaideh(2006)提出了一种依赖于带角度迭代的算法。为了确定倾斜角,投影轮廓被应用于具有多个角度的旋转图像。对应于较高峰值的角度被认为是倾斜角。Pechwitz和Maergner(2002)提出了一种基于轮廓线的阿拉伯笔迹基线检测方法,其中轮廓线由分段线性曲线近似,基线是最适合边缘的直线。已经提出了根据单词轮廓表示来检测阿拉伯手写基线的另一种方法(Farooq等人, 2005年)。 它基于应用于单词轮廓的局部最小点的两步线性回归,而Burrow(2004)提出了一种基于主成分分析的方法来检测阿拉伯笔迹基线。提出了一种新的两阶段方法,用于估计和校正阿拉伯语和波斯语文本行中手写子词的基线(Ziaratban和Faez,2008年)。最后,Boubaker等人(2009年)提出了一种算法来检测短阿拉伯手写体的直线或曲线基线。当文档被送入扫描仪时,不可避免地会出现小的倾斜这会影响识别系统后续算法的准确性。为了解决这个问题,我们采用了倾斜校正程序,它确定了一个倾斜角度从一页的文本行。对于阿拉伯文字,大多数字符在文档图像的较低基线上具有大量因此,我们建议将倾斜角计算为文本行的为了提高直线检测的准确性和减少数据量,我们只对文档图像下边缘的相关连接像素应用随机Hough变换。本文的组织结构如下。第二节介绍了阿拉伯文字的特点。第三节详细介绍了倾斜校正和基线检测算法的步骤。在第四节中,给出了实验结果,并给出了一些分析。第5节给出了一些结论。2. 阿拉伯文字特征阿拉伯语是由超过2.5亿人写的,从本质上讲,阿拉伯语文本在手写和印刷形式中都是天生的草书,并且是从右向左水平书写的。字母表包含28个不同的字符,其中16个有变音符号。变音符号可以在字符的上方、内部或下方,从而形成不同的语义和发音。不同的阿拉伯文字可能具有完全相同的形状,并且仅通过添加五个变音符号中的一个来彼此区分这些是表1各种形式的阿拉伯字母表(EF结尾形式、MF中间形式、BF开头形式和IF孤立形式EFMFBF如果EFMFBF如果ـﺾـﻀـﺿـﺽـﺎﺃـﻂـﻄـﻃـﻁـﺐـﺒـﺑـﺏﻇــﻈـﻇـﻅـﺖـﺘـﺗـﺕـﻊـﻌـﻋـﻉـﺚـﺜـﺛـﺙـﻎـﻐـﻏـﻍـﺞـﺠـﺟـﺝـﻒـﻔـﻓـﻑـﺢـﺤـﺣـﺡـﻖـﻘـﻗـﻕـﺦـﺨـﺧـﺥـﻚـﻜـﻛـﻙـﺪﺩـﻞـﻠـﻟـﻝـﺬﺫـﻢـﻤـﻣـﻡـﺮﺭـﻦـﻨـﻧـﻥـﺰﺯـﻪـﻬـﻫـﻩـﺲـﺴـﺳـﺱـﻮﻭـﺶـﺸـﺷـﺵـﻲـﻴـﻳـﻱـﺺـﺼـﺻـﺹ通常是一个,两个或三个点,“哈姆扎“或”梅达”。例如,三个不同的字符(,,)具有相同的主要形状,但不同的变音符号。与拉丁语不同,阿拉伯语字符不分大小写。相反,一个阿拉伯字符可能有几个 形状,这取决于它在一个单词中的相对位置(开始,中间,结束或单独),例如(,)。表1显示了一套完整的阿拉伯字符,其所有形式取决于它们在单词中的位置。有六个字符不能连接到左边。这些字符将被称为子字的最后字符(,)。阿拉伯语书写是草书,单词由空格分隔。然而,一个单词可以被划分为更小的单元,称为子单词(单词的一部分,包括一个或多个连接的字符)。大多数字符在书写线上相互连接,我们称之为基线。基线检测是阿拉伯字符识别系统中非常重要的一个阶段。图1描述了阿拉伯文字的主要特征。3. 倾斜校正和基线检测算法如果原始文档是灰度或彩色的,则必须对文档图像进行二值化。接下来,通过去除孤立像素并填充图像中的间隙来平滑二值图像该方法是基于检测较低的基线的文件的话。由于下基线像素属于文字图像的下边缘,因此我们首先确定下边缘像素。为此,我们逐列垂直扫描二值化图像,每个黑白过渡位于黑色像素处,其他黑色像素将被转换为白色像素。生成的图像将突出显示文本的基线。图2b显示了通过在图2a上垂直定位黑白过渡而得到的图像。凌晨2在下边缘检测的同时,利用标记算法将边缘图像分割成连续的前景像素曲线。分割算法的主要思想是将垂直方向上不同黑白过渡的像素为了提取连接的像素,我们使用一个简单的顺序过程,该过程比较边缘图像的连续像素,以确定任何边缘中的黑色像素是否倾斜校正和基线检测算法31下基线图1阿拉伯文字的主要特征(一)(b)第(1)款(c)第(1)款(d)其他事项(五)图2举例说明了倾斜校正和基线检测算法:(a)倾斜的文本图像;(b)连接在一起。然后利用该算法提取边缘图像,并将其分割成若干条曲线。在边缘分割步骤之后,去除孤立像素,并且还计算所得曲线的平均长度b接下来,保留长度大于或等于b的曲线通过在b处进行阈值化,诸如点、标点符号和没有较低基线的字符的分量的小边缘大多被过滤掉。 以这种方式,在偏斜估计步骤之前过滤掉小的分段,参见图。 2杯因此,我们大大减少了将用于偏斜和基线检测的数据量。接下来,将随机化霍夫变换应用于所得曲线的像素以检测直边缘。传统的Hough变换是一个投票过程,需要对图像中所有通过给定黑色像素的直线的集合累积不同参数的计数。这种变换需要大量的存储需求和昂贵的计算成本,这取决于黑色像素的数量和要被转换的参数的数量点子词孤立字符32A. 布哈鲁巴.Σ¼¼þ累积。在标准霍夫变换中,需要两个参数来描述直线为qxcoshy sinh。然而,只有一条线可以通过两个像素,如果我们一次选择两个像素,则需要累积一个参数。因此,我们可以累积角度h的投票数检测直线,这大大减少了参数空间中的投票数。为了限制像素对组合的数量并确保霍夫变换的快速计算,我们选择使用小的随机样本集而不是完整的数据集(Xu等人, 1990年)。在我们的算法的随机Hough变换,累加器空间被构造为一个数据结构,在积累过程中动态构建,而不是一个预定义的累加器数组。详情列示如下。随机选择两个边缘像素,并且连接它们的线和X轴harctg yk-yi计算了xk-xi得到的角度被放入定义角度h的向量和整数累加器中。重复像素选择和角度推导的过程,并且对于每个新的解,如果倾斜校正和基线检测算法33--.Σ¼所需的向量已经存在(在某个指定的容限内),则其累加器值加1,否则创建新的向量并且其计数被设置为1。当累加器中的计数达到某个预定义的阈值时,检测到一行图2d示出了图1的边缘图像的方向直方图。 2杯本文将随机Hough变换的开新容差设为0.2°h,线检测阈值设为200计数。一旦确定了倾斜角度,图像就会向相反的方向旋转相同的角度,从而使文本行变为水平。图 2 a和e分别显示了斜校正前后的阿拉伯文本。然后,在倾斜校正之后,使用下边缘图像的水平投影来获得基线,而不进行上述分割处理。具有最大像素数的行被视为文本的下基线 图图2e示出了校正后的文本图像的下边缘图像和下基线的水平投影。如果倾斜角等于零,则我们不进行校正,并且使用相同的所得滤波边缘的水平投影来确定基线此外,该算法还可以用于基线检测,而无需倾斜校正,以减少所消耗的时间,并避免由于图像旋转,特别是轻微倾斜的文件退化。为此,我们应用相同的算法来找到基线方向h。接下来,我们可以使用基于投票的方法来确定y截距c=y-mx,其中m=tg(h)是基线的斜率,(x,y)是曲线像素的坐标。得到的截距被放入一个向量中,在累加过程中动态构建,定义了y轴截距和一个整数累加器。对于每个新的y轴截距,如果所需的向量已经存在(在某个指定的容差内),则其累加器值增加1,否则创建新的向量,并将其计数设置为1。重复该过程,直到没有更多的前景像素被发现。最后,最高峰直接定义最主要基线的y截距,等等。注意,下边缘图像不包含垂直段,因此我们没有问题来计算y截距。打开新的蓄电池单元的容限被设置为2个像素。图3示出了没有偏斜校正的基线检测算法。 这里Fig.图3c示出了图3b的所得滤波边缘图像的方向直方图,其中最高峰对应于角度h=13.17°。图3d示出了对应于h=13.17 °的y轴截距直方图,并且每个聚类的最高峰对应于一个y轴截距。从这个直方图中,我们可以区分出四个y轴截距364.70、445.80、526.50和606.53,它们对应的基线如图2所示。 3 e.总而言之,该算法的主要步骤是:步骤1. 下边缘确定和分割逐列垂直扫描二值化图像,并在黑色像素处定位每个同时,使用如上所述的标记算法将该边缘图像分割成连续曲线。步骤2. 小边缘滤波去除孤立的像素并计算结果曲线的平均长度b。仅保留长度大于或等于b的曲线。步骤3. 倾斜角检测随机选择两个边缘像素并计算倾斜角:xk-xi重复像素选择和角度推导过程,直到累加器达到预定义的阈值。最高峰值直接定义倾斜角。步骤4.倾斜校正的基线估计在相反的方向上旋转图像相同的角度,使文本行成为水平的。使用下边缘图像的水平投影确定基线。具有最大像素数的行作为文本的基线。步骤5. 基线估计无倾斜校正使用投票方法确定y轴截距c=y-mx其中m=tg(h)是基线的斜率,(x,y)是曲线像素的坐标。将所得截距放入一个向量中,在累加过程中动态构建,定义y轴截距和整数累加器。重复该过程,直到不再找到前景像素。最高峰直接定义最主要基线的y轴截距,依此类推。4. 结果和讨论本算法的性能已分别测试手写和印刷文本的样本。我们收集了各种印刷的阿拉伯文文件,包括杂志,书籍和报纸。这些手写的文本是从学生的字帖中收集的图像由扫描仪以300 dpi的分辨率数字化。所提出的方法也已经在IFN/ENIT上进行了测试(Pechwitz 等人,2002年)数据库由26,459阿拉伯文字手写的411个不同的作家。为了估计文本图像的倾斜角度,我们计算累加器bin的前两个最大值之间的差。如果差值超过某个预定阈值T1,则最高峰直接定义文本的倾斜(方向),如图1所示。否则,基线不准确,方向直方图提供的聚类模式构成一组基线。如果只有一个明显的聚类,那么只有一个基线,其中位于其上的像素不完全共线。倾斜角被选择为累加器仓超过阈值 T2的方向的平均值。在下面的实验中,T2被设置为100个计数。如果在方向直方图中存在多于一个聚类模式,则每个聚类模式可以对应于局部子字基线。局部倾斜角是超过阈值T2的箱的平均值。由于局部偏斜角彼此不同,估计的全局基线的偏斜由局部偏斜的平均值来近似。在实验中,来自不同书籍的861页和许多样本的阿拉伯文文件的图像取自阿尔及利亚报纸被认为是。图4(a)-(b)显示了从阿尔及利亚报纸上获取的倾斜图像样本图4(d)-(f)示出了它们的偏斜校正的文档。34A. 布哈鲁巴(一)(b)第(1)款(五)(c)第(1)款(d)其他事项图3没有倾斜校正的基线检测算法;(a)原始文档图像;(b)过滤的边缘图像;(c)方向直方图;(d)y截距直方图;(e)原始文档的基线(文本行)(a)(b)第(1)款倾斜校正和基线检测算法35(d)(五)(c)第(1)款(f)第(1)款图4印刷文档图像样本:(a)(d)- (36A. 布哈鲁巴此外,还考虑了不同字体(阿拉伯透明,简化阿拉伯和传统阿拉伯),不同大小和风格(粗体和斜体)的印 刷 文 本 的 实 验 。 打 印 文 档 的 方 向 都 被 正 确 识 别(100%成功率),然后这些文档通过检测到的倾斜角成功地进行倾斜校正。这是合理的,因为在阿拉伯文印刷文件中最常用的字体中,下边缘清楚地强调基线。对于手写文本,性能测试样本取自学生这些示例图像中的文本每一行手写文本平均由10个单词组成。本技术在提取所有这些文本行的倾斜角度方面也显示出100%的成功率。图5示出了一些偏斜的以及从学生的抄写本中获取的倾斜校正的文档图像。一旦计算了倾斜角h,我们就可以成功地检测打印/手写文档的较低基线,而无需使用上述y截距直方图进行倾斜校正因此,该算法可用于检测(一)(b)第(1)款图6基线检测和无倾斜校正的文本行提取:(a)打印文档;(b)手写文档。(b)第(1)款(c)第(1)款(一)(五)(d)其他事项(f)第(1)倾斜校正和基线检测算法37款图5从学生的抄写本中提取的手写文本样本38A. 布哈鲁巴基线和提取文本行从阿拉伯文文档中所示的图。六、该技术在检测短阿拉伯手写书写的基线时也显示出良好的结果,其中低边缘清楚地强调基线,即使是单个单词。对于IFN/ENIT数据库,我们使用上述方向和y截距直方图检测了突尼斯城镇/村庄名称的基线,而没有进行偏斜校正。图7示出了来自IFN/ENIT数据库的一些示例及其对应的基线,其中每个估计的基线是真实的或非常接近真实的。图7来自IFN/ENIT数据库的示例及其相应的基线。(一)(b)第(1)款图8只有一个聚类对应于真实基线的示例:(a)方向直方图;(b)真实基线。倾斜校正和基线检测算法39表2与测试文献中其他方法的比较在IFN/ENIT数据库里方法PCA(Burrow,2004年)Hough投影(Pechwitz和Maergner,2003)基于伊顿(Pechwitz和Maergner,2003年)该方法基线估计准确度(%)82838895对于IFN/ENIT数据库中的大多数病例,该算法能较好地检测出基线。然而,在某些情况下,它失败了,其中检测到的角度和/或y轴截距(对应于最高峰的聚类)不是真实基线的角度和/或y轴截距。在分析了该系统所造成的误差后,我们发现这种混淆是由上升和下降引起的,它们改变了像素坐标的分布,使得假基线和真基线同时出现这些上升器和下降器影响斜交角和/或y轴截距。从实验中观察到,当倾斜角大于4°时,会出现假基线。在这种情况下,在倾斜角评估中不考虑角度大于4°的簇。 但如果不存在任何角度小于4°的聚类,则保留最显著的聚类作为解。图8示出了具有两个集群的一个示例,其中仅第一集群(角度=1.23°)对应于真实基线。第二种类型的错误发生时,斜交角是正确的估计,但y轴截距如我们所知,基线应该出现在图像的中间区域;因此,算法必须在该区域找到峰值 图 9示出(一)真基线假基线(b)第(1)款图9正确的y轴截距对应于第二个最重要聚类的示例:(a)y轴截距直方图;(b) 真基线和假基线。40A. 布哈鲁巴(一)(b)第(1)款图10基线与真实基线失调的示例:(a)子字具有不同基线的示例(b)例如,城市名称的一部分完全对应于真实基线,但其余部分位于孤立字符的下边缘(一)(b)第(1)款(五)倾斜校正和基线检测算法41(c)第(1)款(d)其他事项(f)第(1)款图11示出了用于英文文本的文本行提取算法的示例:(a)倾斜的文本图像;(b)平滑的图像;(c)平滑的图像的滤波的低边缘;(d)提取的基线(文本行);(e)方向直方图;(f)y截距直方图。42A. 布哈鲁巴一个例子,其中斜交角被正确地估计,但是真实的y轴截距对应于y轴截距直方图中的第二个最重要的聚类。第三种类型的混淆发生在倾斜角和y轴截距都被错误地估计时。在这种情况下,解决方案是前两个解决方案的组合。通过这些改进,我们的成功率达到了95%。这些结果表明,我们的算法提供了良好的性能相比,文献中报道的结果。表2显示了与在IFN/ENIT数据库上测试的其他方法的比较在常见的混淆中,错误率计算如下:一些混淆错误是由于城市名称的子词具有相同的倾斜度,但具有不同的基线这些基线可能彼此不同。作为解决方案,选择全局基线的y截距作为所讨论基线的所有y截距的平均值。图10a示出了单词(子单词)具有不同基线的示例。另一种错误是混淆了相关基线和由孤立字符组成的单词的下限行,如“,”。 图图10b显示,城市名称的一部分完全对应于真实基线,但其余部分位于孤立字符的下边缘。与文献中的方法相比,我们的算法处理的像素数更少,其结果似乎更准确(如表2所示)。其他方法需要多个步骤,例如基于图像旋转的投影直方图(Al-Rashaideh,2006)或更复杂的计算,如标准霍夫变换和基于骨架的方法(Pechwitz和Margner,2002,2003)。与PCA方法(Burrow,2004年)相比,我们的算法需要更少的计算时间,特别是如果下边缘强调下基线;较少量的下边缘像素就足够了,基线直接检测而无需旋转图像。此外,我们可以将所有提到的方法应用于下边缘图像而不是整个图像。因此,我们可以大大降低这些算法的计算复杂度。该技术的优点是,它也可以应用于其他语言的文档,其中直边实际上存在于图像中。对 于 基 于 拉 丁 字 母 的 字 母 的 语 言 ( 英 语 , 法语.. . ),我们使用(Yin,2001)中描述的相同算法来计算倾斜角。 在应用水平游程平滑过程并定位文本图像上的黑白过渡之后,我们通过随机Hough变换来确定倾斜角。然后利用y轴截距直方图提取基线,无需进行倾斜校正.在实验中,考虑了来自不同书籍和报纸的400页 一个例子说明了基线提取算法的英文倾斜文本图像显示在图。 十一岁还考虑了对具有不同字体、大小和样式的印刷文本的实验。结果表明,印刷文档的基线都得到了正确的估计。注意,上述每个检测到的基线对应于一个文本行,这可以帮助我们成功地将文本分割成单独的文本行而无需倾斜校正。实验结果表明,该算法在图像中存在直线边缘的情况下具有很好的效果。5. 结论提出了一种新的阿拉伯文文档倾斜校正和基线检测的快速算法我们的方法的主要新颖之处在于,由于较低的基线属于下边缘的话,我们适用于一个随机Hough变换的下边缘图像的相关像素检测倾斜角。然后使用y轴截距直方图提取基线,并进行或不进行倾斜校正。据我们所知,这样的算法已被应用于既不倾斜校正,也不为阿拉伯文字识别领域的基线检测该算法的主要优点和优点是:整个文件图像减少到一个相关的下边缘图像使用一个简单的标记算法。因此,我们的算法仅基于对下边缘像素的方向直方图和y对于均匀倾斜的文档,我们只需要提取文档的一对于y轴截距检测,我们仅使用方向直方图中的显著聚类(峰值)进行投票(对于均匀偏斜文档,一个y轴截距直方图,对于多偏斜文档,一个以上)。因此,与同时投票(斜率,y截距)相比,我们大大降低了计算成本。方向直方图不足以定位直线,特别是在多倾斜图像和短阿拉伯文字中。然后我们必须通过分析y轴截距直方图来验证它。利用y-截距直方图,本文的工作可以为从印刷文本和手写文本的文档图像中提取文本行做出重要贡献。此外,该技术的优点是,它可以适用于不同的应用程序的直线段检测。该系统的主要缺点是在某些情况下阿拉伯语手写文字(IFN/ENIT数据库)较短,其中下边缘点不强调直线或子直线。单词不严格对齐。对于未来的研究,我们计划扩展和调整我们的算法以检测弯曲基线,其中较低的基线应适应每个子字而不是全局设置(Boubaker等人, 2009年)。引用Al-Rashaideh,H.,2006.阿拉伯文字手写识别的预处理阶段。俄罗斯科学院Sci. 6(1),11-19.Boubaker,H.,Kherallah,M.,Alimi,上午,2009.一种新的阿拉伯短手写体直线或曲线基线检测算法。第10届国际文件分析和识别会议论文集。Burrow,P.,2004年阿拉伯语手写识别(硕士)thesis)。英国爱丁堡大学。哈吉河,Likforman-Sulem,L.,莫克贝角,2005年使用基线相关特征和隐马尔可夫模型的阿拉伯手写体识别。输入:程序第八届国际会议 文件分析和识别(ICDAR '05),卷。20. IEEE,pp.1520 -5263,5.倾斜校正和基线检测算法43法鲁克,F.,Govindaraju,V.,Perrone,M.,2005.手写阿拉伯文文档的预处理方法。载于:《第八届文件分析和识别国际会议论文集》(ICDAR'05),第1卷。IEEE,pp. 267-271。O’Gorman,卡斯图里河(编),一九九五年文档图像分析。IEEE Computer Society Press,New York.帕潘德里欧,A.,加托斯湾,Perantonis,S.J.,杰拉迪斯岛2014. 基于新的增强轮廓组合的印刷文档图像的有效倾斜检测。 IJDAR 17,433-454.Parhami,B.,Taraghi,M.,1981.自动识别印刷波斯语文本。模式n。14(1-6),395-403。Pechwitz,M.,Maergner,V.,2002.阿拉伯手写文字的基线估计。在手写识别的前沿,479-484。Pechwitz,M.,Maergner,V.,2003.基于隐马尔可夫模型的方法,手写阿拉伯字识别使用IFN/ENIT-数据库。In:ICDAR.IEEE Computer Society,pp. 890- 894Pechwitz,M.,Snoussi Maddouri,S.,Maergner,V.,Ellouze,N.,Amiri,H.,2002. IFN/ENIT-手写阿拉伯语单词数据库。In:Proceedings CIFED'02,pp. 129比1361994年,Saba,T.,2011.文档倾斜估计和校正:技术分析、常见问题和可能的解决方案。应用人工制品内特尔25,769-787。Saba,T.,Sulong,G.,1994年,2011.文件影像分析:议题、方法比较与遗留问题。第内特尔Rev. 35(2),101-118.Shafii,M.,Sid-Ahmed,M.,2015.基于轴平行包围盒的倾斜检测与校正。IJDAR 18,59-71.Tang,Y.Y.,Lee,S.W.,孙振英,1996.自动文件处理:综述。模式n。29,1931-1952.徐,L.,Oja,E.,Kultanen,P.,1990.提出了一种新的曲线检测方法:随机Hough变换(RHT).模式n。Lett. 11,331-338。Yin,P.Y.,2001.印刷文档的倾斜检测和块分类。图像可见Comput. 19,567-576。Ziaratban,M.,Faez,K.,2008. 波斯语和阿拉伯语手写文本行基线估计和校正的一种新的两阶段算法。第19届模式识别国际会议(ICPR 2008)。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- NIST REFPROP问题反馈与解决方案存储库
- 掌握LeetCode习题的系统开源答案
- ctop:实现汉字按首字母拼音分类排序的PHP工具
- 微信小程序课程学习——投资融资类产品说明
- Matlab犯罪模拟器开发:探索《当蛮力失败》犯罪惩罚模型
- Java网上招聘系统实战项目源码及部署教程
- OneSky APIPHP5库:PHP5.1及以上版本的API集成
- 实时监控MySQL导入进度的bash脚本技巧
- 使用MATLAB开发交流电压脉冲生成控制系统
- ESP32安全OTA更新:原生API与WebSocket加密传输
- Sonic-Sharp: 基于《刺猬索尼克》的开源C#游戏引擎
- Java文章发布系统源码及部署教程
- CQUPT Python课程代码资源完整分享
- 易语言实现获取目录尺寸的Scripting.FileSystemObject对象方法
- Excel宾果卡生成器:自定义和打印多张卡片
- 使用HALCON实现图像二维码自动读取与解码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功