没有合适的资源?快使用搜索试试~ 我知道了~
~沙特国王大学学报基于FPGA的扫描文档图像透印去噪点处理Habibunnisha Nazeer,Nedumaran Damodaran中央仪器和服务实验室,马德拉斯大学,Guindy校区,Chennai 600 025,泰米尔纳德邦,印度阿提奇莱因福奥文章历史记录:接收日期:2022年2022年10月20日修订2022年12月1日接受2022年12月7日在线发布保留字:文档图像二值化现场可编程门阵列DSP生成器点处理多级阈值A B S T R A C T文档图像二值化是图像增强技术中的一种,在文档图像分析与识别(DIAR)领域有着潜在的在DIAR过程中,不同类型的噪音,如不均匀的照明,杂波,边缘,倾斜,渗透和显示通过被删除。然而,透印噪声的去除是一项具有挑战性的任务,因为它主要影响文档图像的质量和可读性。在这项工作中,我们设计并开发了一个基于模型的点处理操作,该操作在Altera Cyclone® V DE 1-SoC中实现,透印噪声和增强退化的文档图像质量。Altera Cyclone® VDE 1-SoC板在性能、尺寸兼容性、实时性等方面优于可编程DSP芯片,因此被选作本研究的开发板。像素/点处理操作是使用DSP构建器工具实现的,它可以更好地执行复杂算法中涉及的计算操作。为了实现所提出的算法,我们在DSP builder中为Altera Cyclone® V DE 1-SoC系列5CSEMA 5 F31 C6板开发了板库文件,并在各种文档图像上进行了测试。所提出的算法在FPGA板上对各种文档图像进行了测试,在文档图像可读性、质量、处理速度和内存大小方面表现出更好的结果此外,所提出的算法的性能进行了研究,在不同的扫描文档图像数据集以及与其他传统的技术。研究结果表明,本文提出的基于模型的点处理方法比其他方法具有更好的性能。版权所有©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍近年来,文档图像分析与识别(DIAR)领域的研究取得了长足的发展缩略语:DIAR,文档图像分析和识别; DIBCO,文档图像二值化竞赛; NMF,非负矩阵分解; OCR,光学字符识别; ASIC,专用集成电路; DSP,数字信号处理器;FPGA,现场可编程门阵列; XSG,Xilinx系统发生器; HIL,硬件在环; JTAG,联合测试行动组; PSNR,峰值信噪比; NRM,负率度量; DRD,距离倒数失真; MPM,错误分类惩罚度量。*通讯作者。电子邮件地址:dnmaran@unom.ac.in(N.Damodaran)。沙特国王大学负责同行审查制作和主办:Elsevier这是由于文件数字化,以创建无纸办公室。DIAR包括通过从扫描的文档图像中提取信息并使用合适的算法进行处理来对文档进行数字化。文档信息可以是文本识别、签名验证、文本到语音转换、标识、姓名、签名、地址等的检测。Diplomat和M.S,2015)。在这个过程中,文档图像二值化是一个重要的步骤,用于布局分析,字符识别,网络传输,文件大小压缩和许多其他应用(Saini,2015)。纸张的成熟度、纹理、不透明度和印刷油墨等因素影响文档图像的二值化。由于这些原因,开发单个算法来满足所有类型的退化文档图像的二值化要求是非常具有挑战性的(Lins等人,2017年)。文档中存在的各种伪影如图1所示,并且是从文档图像二值化竞赛(DIBCO)数据集2014("/ bgat/HDIBCO2014/基准标记的索引”,n.d. ).在图1中,文档图像受到透印噪声(a,g,h,i,j)的影响,轻微受透印噪声(a,g,h,i,j)的影响,https://doi.org/10.1016/j.jksuci.2022.12.0011319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comH. Nazeer和N. Damodaran沙特国王大学学报2972D孟加拉国b图1.一、文档图像中存在不同类型的伪影(数据集DIBCO 2014)。给出了噪声(b,d)、墨滴(c)、老化和墨滴(e)以及模糊文本(f)。从图1中可以明显看出,大多数文档图像都受到透印噪声的影响。因此,委员会认为,如果双面文档用白色背衬扫描,则文档的正面Rf(x,y)和背面Rb(x,y)反射率的等式由下式给出,从文档图像中去除透印噪声将Rx;yT2x;yS莱特河T2x;y2提高文件的可读性、质量和进一步处理的效率和分析 在全球范围内,各种传统的二值化方法fDDBKB并且在历史/退化的文档图像上实现了几种机器学习技术,并且它们的 时 间 质 量 评 估 显 示 传 统 算 法 比 其 他 最 近 的 技术 表 现 得 更 好(DueireLins等人,2019;Lins等人, 2021年)。最初,Lins et al. 报道了这个问题,称之为“后-前干扰”(Lins等人,1994年)。后来,其他研究人员将其称为当扫描像双面打印/手写文档这样的文档时,来自页面背面的信息/数据与扫描图像的正面信息相干扰,这被称为透印噪声。如果扫描带有白色背衬的白纸(未印刷的文档),则扫描仪的光学传感器反射率的公式为:Rw¼S DT2Rbk1Rbx;yT2x;ySDT2Rbk T2x;y3使用等式(2)(3),可以估计背面的透印效果对正面扫描的影响(Sharma,2001)。2. 相关作品研究人员已经开发了几种二值化方法来去除退化文档图像中的透印噪声。它们被分类为基于直方图的方法、基于二值化的方法、基于形态学的方法、基于模糊的方法和遗传算法方法(Farahmand等人,2013; Ganchimeg,2015)。De和Rawal提出了一种简单的基于内容的全局二值化方法,从扫描的图像中去除渗色效果的D D他们的研究结果表明,开发的方法可以其中SD和TD分别是透射率和被文档散射的光,并且Rbk是背衬的反射率。从等式(1)、白纸在黑色背衬上的反射率,即, Rbk = 0由SD给出,白色背衬,即, Rbk = 1由SDT2给出。不区分前景内容的不同颜色(Shankha De,2018)。Merrikh-Bayat等人,提出了一种基于梯度的非负矩阵分解(NMF)方法来去除穿透噪声。最初,他们尝试了一种线性混合模型来减少噪音,但它并不适合H. Nazeer和N. Damodaran沙特国王大学学报298消除显示噪声。为了克服这一点,他们通过修改NMF算法中涉及的成本函数来使用非线性混合模型(Merrikh-Bayat等人, 2010年)。Langkam和Deb提出了一种用两个卡尔曼滤波器估计状态和参数的状态空间方法来消除穿透噪声。模拟结果显示出低相似性测量和视觉改善的图像(Langakam和Deb,2017)。Ourdou等人提出了一种新的基于Copulas理论的盲源分离技术,对依赖结构进行了建模,提高了文本的可读性和OCR效率(Ourdou例如,2020年)。Chen提出了一种多层感知器方法,通过融合白色背景的扫描图像和黑色背景的扫描图像,并从手动校正的扫描图像中估计融合映射(Chen,2017)。阈值技术曾 试 图 消 除 由 于 照 明 不 均 匀 而 产 生 的 透 印 伪 影 和 阴 影(Deivalakshmi,2017; Pérez和Gonzalez,1987)。专用集成电路(ASIC)和数字信号处理器(DSP)吸引了许多计算机视觉开发人员来优化他们的设计。但是,这些设备具有一定的局限性,并且很难针对特定应用重新配置硬件组件。另一方面,现场可编程门阵列(FPGA)具有为任何应用重新配置硬件组件的能力,这吸引了硬件设计人员解决其设计的快速原型Moreo等人研究了使用Xilinx System Generator(XSG)对图像执行增强算法的基于硬件的方法,XSG用于配置MATLAB Simulink软件。 在这项工作中,数字逻辑块和DSP功能用于创建基于模型的设计文件,并在Xilinx VirtexXCV 800 FPGA器件中实现(Moreo等人,2005年)。在Virtex 6 XC6VS 315 T-3FF 156 FPGA器件中开发并测试了用于图像处理的空间图像滤波器设计(Elamaran等人, 2012年)。在SPARTAN 3 XC 3S200 - 5 FT 256和Virtex II Pro XC 2 VP 7 - 6 FF 672上实现了用于视频处理的色彩空间装置(Saidani等人,2009年)。使用Spartan 3 XC3S200 FPGA开发板(Ravi等人,2013年)的报告。使用XSG在FPGA平台中测试了广泛的 图 像 处 理 应 用 , 如 算 术 运 算 、 逻 辑 运 算 、 直 方 图 和 强 度 变 换(Elamaran和Rajkumar,2012)。在SPARTAN 6 FPGA器件中成功测试了各种形态学和强度图像处理算法,如灰度和彩色图像的图像负片、图像增强、阈值处理、对比度拉伸、边缘检测和边界提取,并研究了FPGA的设计、模拟时间和合成时间的优势(Raut和Gokhale,2013)。针对灰度图像和彩色图像,实现了一种图像增强的抛物线变换方法。结果表明,与其他报道的作品相比,观察到的资源利用率降低了约39%(Balaji和Allin Christe,图二. Cyclone® V DE 1-SoC-MLT 2开发板的俯视图。图三. 生成的Cyclone® V DE 1-SoC板块及其组件的屏幕截图。H. Nazeer和N. Damodaran沙特国王大学学报299×见图4。 全局阈值方法的框图。2015年)。FPGA器件如Virtex 5 XUPV 5-LX 110 T(Mohammed等人,2014年)和Virtex XC 5VLX 100 T-3FF 136(Anil Kumar和VijayaKumar,2014年)被部署用于测试几种图像处理应用,如图像增强、边缘检测、对比度拉伸、灰度和彩色图像的后处理步骤。Narula和Singla在Verilog HDL中开发了图像增强步骤,并在Altera Cyclone®IV EP 4CE 22 F176 N FPGA 开 发 板 上 进 行 了 测 试 ( Narula 和Singla,2018)。这些是在FPGA环境中尝试的图像处理步骤的一些示例,但没有针对DIAR等特定图像处理应用的文献报道。相反,许多最先进的二值化算法和技术都是在软件领域中尝试的。因此,本文的重点是基于硬件的方法来实现新的算法,以消除通过使用FPGA的文档图像噪声。此外,文档图像的像素尺寸很大(例如:1925 688像素),因此FPGA的大存储器和I/O设施等特性适合实现DIAR应用。3. 硬件和软件详细信息3.1. Cyclone®V DE 1-SoC-MLT开发套件DE 1-SoC-MLT 2开发板因其易于配置自定义处理器和适用于所提议应用的IP而被选择用于显示式去噪。此外,制造商提供用于设计应用的集成平台,其包括硬件、嵌入式软件、设计工具和参考设计等。(图2显示了用于实现所提出的工作的Cyclone开发板3.2. DSP builderDSP工具用于连接MATLAB Simulink与Altera Quartus II Prime软件。此外,它还支持Stratix、Cyclone、APEX和FLEX器件系列,并具有SignalTap II逻辑分析仪、硬件在环(HIL)和状态机模块等功能(AlteraCorporation,2005)。在拟议的工作中,使用DSPbuilder开发了Cyclone®V 5CSEMA 5 F31 C6器件的板库,并用于实现所提出的增强算法。3.2.1. 为Cyclone® V DE 1-SoC创建板库开发板库的基本思想是构建一个自定义板库,以利用DSP构建器中的内置板组件来实现所建议的应用。这将使用XML文件表征DSP构建器,以配置FPGA板细节和引脚。 在此开发过程中,我们首先为Cyclone V 5CSE-MA5 F31 C6 N编写了板描述文件(.board),保存在安装Quartus Prime II软件的路径中。文件中包含一个标题部分和一个电路板描述部分,用于指定文档H. Nazeer和N. Damodaran沙特国王大学学报300.ðÞ ¼T0≤f<$x;y<$≤T 1>:图五. 多阈值方法的框图。字符编码构成电路板详细信息的特性和子元件在电路板描述部分中定义。图像的图标、宽度和高度是配置参数,在XML文件中提到并保存在相应的文件夹中。器件子元素包括JTAG代码、器件名称、标签、引脚位置以及时钟或复位引脚。XML文件中包含的设备和计算机( Altera , 2010; Altera Corporation , 2008; Habibunnisha 和Nedumaran,2022)。使用板库,Cyclone V 5CSE-MA5 F31 C6板及其组件的配置如所示图3.第三章。4.1.1. 全局阈值在全局阈值处理中,将每个输入像素与给定阈值水平进行比较,并且基于大于(1)或小于(0)给定阈值的特定像素的值来分配相应的二值化输出值。这种技术在分离文档图像的前景和背景方面非常有效(Bailey,2011)。当量(5)表示全局阈值化操作,并且在所提出的工作中实现的全局阈值化方法的框图在图中示出。 四、4. 方法T x;y1;iffx;y>T0;if f<$x;y<$6Tð5Þ4.1. 点操作点运算是数字图像处理(DIP)中的基本运算之一,其中输出像素值取决于数字图像的相应输入像素值,并且在数学上表示为等式(1)。(四)、q½x;y] <$fp½x;y]4其中f是任意函数,p[x,y]表示输入像素值4.1.2. 多级阈值在文本图像中,单一的阈值并不适合于整个文本从显示透和其他噪声中识别文本。此外,如果在图像中采用多阈值处理,则可以提高分割的质量(Bailey,2011)。多级阈值化方法表示为等式(Eq.(六)、 8m,如果f x y T1;n;如联系我们并且q[x,y]是对应的输出像素值。硬件点处理的实现非常简单,因为硬件支持顺序操作模式。这里,每个输入像素可以直接通过硬件模块,并且相应的输出在同一模块中可用,这是许多图像处理应用的要求,如对比增强,边缘检测,阈值处理,分割,掩蔽等(Bailey,2011)。o;if f<$x;y<$6T0这里,两个阈值T0和T1用于将文档图像分成三个部分,即,前景、背景和阴影。T0(低阈值)和T1(高阈值)的阈值选择在两个直方图谷的中心附近。图5示出了多级阈值化方法的FPGA框图。Q=x;y=1ð6ÞH. Nazeer和N. Damodaran沙特国王大学学报301>4.1.3. 轮廓互补法轮廓是多级阈值化的另一种形式。它需要在Eq中进行微小的修改。(6)并在像素范围内选择阈值。在该方法中,将输入图像像素与两个(低和高)阈值进行比较,比较结果决定并分配最小和最大像素值。然后,输出像素的值被完成并保存(Bailey,2011)。 等值线-互补法的数学表达式在方程中给出。 (7)和相应的框图中所示的图。 六、工作区块用于在MATLAB中运行输入脚本文件,以将输入文档图像馈送到程序中。它将原始文档RGB图像转换为灰度图像。然后,根据输入图像像素(图像的多重长度和高度)固定停止时间,并在DSP Builder工具中运行模拟,如图所示,该工具被标记为红色。 四、仿真完成后,在MATLAB软件中运行输出脚本文件。它将输出图像文件保存在给定的路径或文件夹中。然后,执行DSP构建器工具中的Signal编译器块。剪切以生成Quartus prime项目文件(.qpf)和脚本文件(.Tcl)。Q=x;y=18><:0;如果255;如果0;如果fx;yx>T1T0≤f<$x;y<$≤T1fx;y6T0ð7Þ随后,执行TestBench生成器块,它自动生成VHDL脚本,并可以选择在ModelSim软件上运行。●轮廓的优点是每像素存储一位,其他方法,但它具有像差的边缘检测和高对比度的图像是不太有效的属性。4.2. 算法实现本节将简要介绍用于消除透印噪声的文档图像点操作的算法开发和实现步骤基于模型的设计(.mdl)程序分为三个部分,如输入图像块(从工作区),算法块和输出图像块(到工作区)。输入和输出文档图像保存在MATLAB工作区中。打开.qpf文件,指定输出的引脚详细信息,然后编译程序。如果编译完成时没有错误,则会添加输出(.sof)文件,以便在目标设备中执行。4.3. 质量措施为了评估所提出的算法的性能,定性和定量的措施已被推荐。在所提出的工作中,我们采用视觉检测作为定性测量和度量,如F-测量,峰值信噪比(PSNR),负率度量(NRM),距离倒数失真(DRD)和误分类惩罚度量(MPM)作为定量测量。采用视觉检查来检查经处理的文档图像的可读性、细节和细节损失。见图6。 等值线互补法的框图。●●●●●●H. Nazeer和N. Damodaran沙特国王大学学报302.Σ联系我们公司简介见图7。 原始输入图像、直方图、输出图像三种方法的提出。专家的信息。但是,定量措施有正式的数学方程,并在这里简要描述1. 峰值信噪比(PSNR)是信号功率和存在的破坏性噪声之间的最大值(Fedorchuk和Lamiroy,2017)。2. 负率度量(NRM)表示基础图像和去噪二值化图像之间的逐像素失配。它是假阴性率NRFN和假阳性率NRFP的平均值之间的比值。 它由以下等式定义(Young和Ferryman,2005; Lu等人,2004年;“文档图像二值化方法的客观评估-文件PSNR10 logc2MSEð8ÞExchange-MATLAB Central,”n.d.; Sari等人,2014年)、NRFN NRFPPMPN¼ANRM¼2ð10ÞMSEx 1/4y¼1MNð9ÞNRFN11TPFFN这里A(x,y)是输入图像像素的强度值,B(x,y)是二值化输出像素的强度值,c2是原始图像和二值化图像之间的强度值的差,MN是像素的总数,MSE是输入和输出像素的功率之间的差与整个图像中的像素的总数的比率。NRFP12公司简介这里,FN、FP、TN和TP分别是假阴性、假阳性、真阴性和真阳性像素的数量2¼H. Nazeer和N. Damodaran沙特国王大学学报303见图8。 在Nabuco数据集图像上测试的三种方法的输出图像。3. 错误分类惩罚度量(MPM)将去噪图像与地面真实图像进行比较。误分类像素与地面实况参考对象的边界用于丢弃它们。用于找到MPM的数学表达式在Eqs中给出。(13)- ( 15 ) ( Yo u ng 和 Fe r r ym an , 20 0 5 ; Lu 等 人 ,20 0 4年;“ 目标H. Nazeer和N. Damodaran沙特国王大学学报3041¼¼PPfn¼¼KKPK见图9。 RTL视图的三种方法:(a)全局阈值,(b)多级阈值,(c)轮廓互补方法。文档图像二值化方法的评估-文件交换-MATLAB中心,”n.d.; Sari等人, 2014年)。MP2。MPfnMPfp13精密TP公司简介召回TPTPFFNð17Þð18ÞNfndiMPfn ¼i½1fnNfpdjMPFP ¼J1FPD这里是di和djð14Þð15Þ是第i个假阴性和第j个假阴性的距离5.距离倒数失真(Distance-Reciprocal Distortion,DRD)是二进制文档图像中视觉失真的度量。它分析了所有S翻转像素的畸变,并且与人类视觉体验具有良好的相关性。这是在Eqs中给出的。(19)和(20)(Young和Ferryman,2005; Lu等人,2004年;“文档图像二值化方法的客观评估-文件交换- MATLAB中心”,n. d.; Sari等人, 2014年)。从参考分割轮廓的正像素的总和一帧中的对象的所有像素到轮廓距离由因子D归一化。通过基于距对象边界的距离丢弃误分类的像素S DRDDRDk¼1NUBNð19Þ算法提取某个物体的成功率较低的MP分数表明该特定算法善于检测对象边缘并有效地分割物理对象DRD ¼X XjGTi;j-Bx;yjωWi¼-2j¼- 2ði;jÞ ð20Þ从现场的物体。4. F-测度用来度量查准率和查全率的调和平均值精度和召回率计算使用之间的关系确定的真和假像素元素。在这里,TP,FP和FN分 别 是 真 阳 性 , 假 阳 性 和 假 阴 性 ( Fedorchuk 和 Lamiroy ,2017)。其中,NUBN是非均匀块的数量,WNm是权重矩阵,DRDk是图像的块Dk4.4. 数据库和工具F测量2×精确度×召回率查全率ð16Þ为这项工作选择的各种算法是在MATLAB 2014 a(Simulink)版本和Quartus prime标准版(版本15.1)中开发的,安装在Intel®core(TM)i5- 44 OS CPU@2.80 GHz处理器PC中,具有Windows7专业操作系统DFPKNmH. Nazeer和N. Damodaran沙特国王大学学报305图10个。三种方法的仿真结果:(a)全局阈值,(b)多级阈值,(c)轮廓互补方法在ModelSim工具中查看系统所有算法都是在从DIBCO数据集2014和Nabuco数据集-2收集的各种文档图像(PNG文件格式)上开发和测试的。使用Quartus prime标准版版本15.1.01855分析了Simulink和DSP构建器工具为所有算法生成的代码,以嵌入目标器件Cyclone® V DE 1-SoC-MLT 2 5CSE-MA5F31 C6 N FPGA中。5. 结果和讨论在Cyclone® V DE 1-SoC-MLT 2 5CSEMA 5 F31 C6 N FPGA开发板中编程的各种阈值点操作算法上测试了从DIBCO数据集2014和Nabuco数据集-2收集的图1(a、h、i、j)中所示的各种受透印效果影响的文档图像全局、多级和轮廓-互补阈值方法获得的输出图像如图1A和1B所示。7和8RTL查看器用于查看我们设计的初始综合结果的图形表示的寄存器传输级(RTL)。由此,我们设计了所需的逻辑,并根据软件仿真测试其正确性。模拟查看器是输入和输出像素值的数字波形表示,带有时钟脉冲。三种方法的RTL设计视图和仿真视图如图1和2所示。9和10,分别。在实施拟议的方法之前,在FPGA环境下,研究了该算法的量化性能。流行的阈值化方法如Otsu、Feng、Wolf和Kapur方法(Feng和Tan , 2004; Kapur 等 人 , 1985;OTSU.N , 1979; Wolf 等 人 ,2002),并与三种拟议方法的结果进行了比较,并总结在表1和表2中。仅在此基础上,选择了三种提出的方法进行硬件实现。所有三点处理方法的硬件利用率和CPU执行时间见表3。表4中给出了处理测试图像之前和之后的内存减少。根据表1、2、3和4,推断总结如下:在表1和表2中,将在FPGA硬件中实现的三种点处理阈值方法与在MATLAB环境中测试的流行阈值方法(如Otsu、Feng、Wolf和Kapur方法)Nabucodataset-2(nabuco- datasets - pCloud,n.d.)的强前后干涉图像。)和DIBCO 2014数据集进行验证。与 Feng 、 Wolf 和 Kapur 阈 值 方 法 相 比 , 该 方 法 具 有 较 高 的PSNR、F-Measure值和较低的DRD、NRM、MPM指标。因此,所提出的三种方法由于其低错误率、算法在所有数据集上的性能以及高质量的输出图像而被考虑用于硬件实现。●H. Nazeer和N. Damodaran沙特国王大学学报表306306~~在各种文档图像上测试的三种阈值方法的性能指标性能度量名称阈值方法DIBCO文档图像H01H08H09H10PSNR全球18.8629521.7624717.5427417.73609多层次16.9481319.9442814.7443914.77033轮廓-补充17.2300320.0345714.7164114.78338大津(OTSU.N,(1979年)19.4292124.0701918.1973318.54055冯(Feng andTan,2004年)14.030918.2129313.2790213.51416沃尔夫(Wolfet例如,(2002年)12.6042816.9123511.3179911.12999卡普尔(Kapur例如,一九八五年)19.6397721.8570716.9242916.58975DRD全球1.83611.349691.67721.62002多层次4.878894.588964.828154.77091轮廓-补充4.515284.466134.915424.75734Otsu2.697771.678142.286881.99647冯11.641679.108218.782068.29166狼16.2264511.8510213.380413.9336Kapur2.524993.838733.553873.8654NRM全球0.086360.105650.06620.06955多层次0.129950.130480.118110.12330轮廓-补充0.110120.122560.109690.11605Otsu0.089790.055880.049530.05138冯0.343360.227140.225370.20994狼0.483640.33410.375410.39234Kapur0.016930.014110.037560.02741MPM(X1000)全球0.136160.013710.736960.49802多层次0.182330.046180.949500.78815轮廓-补充0.188910.05661.311360.9256Otsu0.065490.096121.377920.80997冯0.858670.50932.20922.53886狼0.730180.081341.803671.87927Kapur0.605861.880873.635243.34697F-measure全球88.0415787.9292590.7539591.04081多层次80.7506885.0638386.9330686.24144轮廓-补充82.5201882.2505982.2378482.18029Otsu89.106193.2294592.1699892.67627冯47.4074568.7523569.7826472.03536狼6.3363349.7315439.8743635.42311Kapur91.0708790.0995190.1006789.63212全局阈值法和轮廓互补法的高峰值信噪比表明,该方法能很好地去除降质文档图像中的穿透噪声。全局阈值和多级方法获得的高F-测量分数确保了比轮廓补充方法更准确的二值化对于全局阈值化方法实现的非常低的NRM和MPM值对于全局阈值化方法实现的非常小的DRD值符合全局阈值化方法比其他两种提出的方法失真更小。在所有三点处理方法中,确定自适应逻辑模块(ALM)使用中的1%逻辑利用率此外,本发明还<4%或18个I/O引脚用于所有点处理方法,耗氧物质在该设计中没有使用DSP块和存储器块位,这突出了实时操作的设计的简单性。处理时间的估计是数据集 二值化的重要参数之一。用Otsu、Niblack、Kittler、Feng、Wolf、Kapur等常用二值化算法对降质后的文档图像进行二值化处理,在MATLAB环境下估计其执行时间在120-180 s之间。 然而,所提出的三种点处理算法表现出92-执行时间为95 s,总结见表3。结果表明,本文提出的算法性能优于其他三种方法。所提出的方法都减少了峰值虚拟内存容量,并且每种方法在Quartus prime软件中执行一个算法的编译时间小于100秒内存大小因阈值而异●●●●●●●H. Nazeer和N. Damodaran沙特国王大学学报307表2在Nabuco数据集图像上测试的三种方法的性能指标性能度量持牌方法Nabuco文献图像扫描_HW_f_nb c0127扫描_HW_f_nb c0745扫描_HW_f_nb c0833扫描_HW_f_nb c1088PSNR全球13.7623914.9512814.4397611.9851多层次16.4642815.4798915.2272410.68337轮廓-补充16.4438216.1020815.2074311.1337Otsu19.8992212.9894417.8237513.06597冯14.1994513.862415.1792210.45829狼12.125211.2670814.4017710.17973Kapur18.5427610.0396314.8479111.03995DRD全球9.638267.639716.3085811.46726多层次3.981656.5350513.0869516.0314轮廓-补充3.976035.3763813.0424714.26217Otsu1.7297113.32436.907567.94308冯8.846811.7668914.3624318.14862狼13.7348920.2571215.8745317.66809Kapur2.7846327.7021514.5897714.18333NRM全球0.048810.040740.041490.05427多层次0.080360.043920.102910.05405轮廓-补充0.086780.052480.121270.05155Otsu0.056690.027910.010880.03157冯0.178720.182760.183710.24115狼0.367420.40690.370010.46097Kapur0.022290.054540.018040.04618MPM(X1000)全球8.9889715.0783824.1009726.42831多层次1.2663413.9641120.3216231.18811轮廓-补充1.1373111.9263418.5421829.09081Otsu0.1281520.935946.423285.72568冯5.58274.62516.1247237.44672狼1.34731.309860.310533.13672Kapur1.8825731.6735610.2630814.10958F-measure全球78.9018684.4498272.1336675.78636多层次86.2660485.8335572.6753770.48488轮廓-补充86.0116387.2052171.6113772.49493Otsu93.5317778.4589885.5005780.60443冯74.1005774.1516767.5609356.66042狼41.9062331.3653541.2038714.51555Kapur92.023664.884474.8781372.35206表3Quartus Prime软件中三种阈值方法的硬件利用率、内存使用率和执行时间控股公司名称硬件利用率峰值虚拟内存(MB)CPU时间方法ALM中的逻辑利用引脚总数块存储器位总数DSP模块总数分析综合钳工汇编程序时序分析器(个)全局阈值2/32,07018/4570/4,065,2800/878772458848112492方法(1%)(4%)(0%)(0%)多层次控股2/32,07018/4570/4,065,2800/878802455853112495方法(1%)(4%)(0%)(0%)轮廓补充2/32,07018/4570/4,065,2800/878792457853112595方法(1%)(4%)(0%)(0%)H. Nazeer和N. Damodaran沙特国王大学学报308表4输入和输出图像的内存大小详细信息名称原始文件执行后的内存大小图像图像尺寸全局保持法(T = 150)多电平保持法(T0 = 150,T1 = 200)轮廓补充法(T0 = 30,T1 = 128)H01H08H09H101.22 MB1.49 MB1.28 MB885 KB9.42 KB5.72 KB11.6 KB9.95 KB52.9 KB41.1 KB48.4 KB43.0 KB17.7 KB11.5 KB18.0 KB14.6 KB这表明,所提出的算法的内存和速度的要求从表4中可以看出,与原始图像大小相比,全局阈值化技术的存储器大小减少了90%,这清楚地表明,所提出的全局阈值化方法的下载速度可以在网络应用中实现时增加。结果,全局阈值化方法有效地用于轻微影响的透印噪声图像。多层次阈值分割和轮廓补充方法在强烈影响的透印图像中表现出更好的性能。与其他实施方法相比的优点总结如下:在短时间内轻松实现DSP设计它不需要用HDL语言编写程序,而是利用信号编译块自动●减少人为错误●减少设计●减少去噪输出图像的内存大小。6. 结论总之,使用DSP builder和MATLAB Simulink工具实现了点处理操作以增强文档图像。基于性能指标,将去噪的输出图像与原始输入文档图像进行视觉比较对于给定的阈值,全局和轮廓互补方法比多级阈值方法显示出更高的PSNR和F-测量值。此外,全局阈值方法具有较低的DRD,NRM和MP指标比其他两种方法。结果,点处理操作对于文档图像中存在的穿透噪声最后,Altera®Anil Kumar,K.,VijayaKumar,M.,2014.用Xilinx System Generator实现图像处理实验。高级图像视频处理2. https://doi.org/10.14738/aivp.25.471。贝利D.G.2011年。基于FPGA的嵌入式图像处理设计,John Wiley Sons(Asia)PteLtd.https://doi.org/10.1002/9780470828519网站。Balaji,M.,Allin Christe,S.,2015年。利用xilinx系统发生器实现各种图像处理算法智能创新系统Technol. 2,59https://doi.org/10.1007/978-81-322-2208-8网站。陈玉,2017年。通过学习使用多层感知器融合两个互补图像来扫描双面文档而不会产生PLoS One 12,1-12. https://doi.org/10.1371/journal.pone.0176969网站。DE 1-SoC-MTL 2用户手册,2014年。太好了Deivalakshmi,S.,2017.不规则照明扫描文档图像中的边界噪声去除、透影和阴影校正。在:发明计算和信息学国际会议(ICICI 2017)的会议记录。pp. 57比60D.迪尔伯恩大学,多发性硬化症,2015.文献图像分析与检索系统综述。Int. J. Cybern.Informatics 4,259-270. https://doi.org/10.5121/ijci.2015的网站。4225Dueire Lins,R.,Kavallieratou,E.,史密斯,E.B.,Bernardino,R.B.,天啊,D. M.德,2019年。ICDAR 2019时间质量二值化竞赛。在:程序国际会议文件Anal.Recog
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功