基于向量场的无段几何校正方法

92 浏览量更新于2023-10-13 收藏 4.56MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

利用向量场对畸变文档图像孟高峰1， 3，苏元奇2，吴颖3，向世明1，潘春红11中国科学院自动化研究所模式识别国家重点实验室，北京{gfmeng，smxiang，chpan}@ nlpr.ia.ac.cn2Xiyuanqisu@mail.xjtu.edu.cn3西北大学，埃文斯顿，美国yingwu@northwestern.edu抽象。本文提出了一种无段的方法，用于对手持摄像机拍摄的失真文档图像进行几何校正。该方法可以恢复的三维页面形状，利用本征矢量场的图像。基于卷曲的页面形状是一般的圆柱形表面的假设，我们通过对向量场的加权多数投票来估计与相机和3D形状模型相关的参数然后通过欧拉方法求解常微分方程（ODE），恢复曲面最后，可以通过将估计的3D页面表面平坦化到平面上来校正图像中的几何失真我们的方法可以利用不同类型的视觉线索，在一个扭曲的文档图像估计其矢量场的三维页面形状恢复。与现有技术的方法相比，最大的优点是它是无段方法，并且不必提取弯曲的文本行或文本块，这仍然是一个非常具有挑战性的问题，特别是对于失真的文档图像。因此，我们的方法可以自由地应用到文档图像具有极其复杂的页面布局和严重的图像质量下降。大量的实验证明了所提出的方法的有效性。关键词：文档图像处理，几何校正，矢量场，三维形状恢复，OCR1介绍近几十年来，在纸质文档的数字化中使用便携式摄像机越来越受欢迎与传统的平板扫描仪相比，使用便携式相机，例如智能手机相机和紧凑型相机提供了许多巨大的优势。例如，它们是便携式的，快速响应的，并且可以灵活地应用于不同大小的文档。然而，由手持式相机捕获的图像经常遭受以下问题：2G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘Fig. 1.一个例子的几何纠正失真的文件图像，我们的方法。(a)失真的文档图像，（b）校正结果，（c）重建的3D页面表面，（d）用于图像去扭曲的所构建的网格。由于页面卷曲和相机透视而导致的严重几何失真。这通常发生在捕获打开的厚且装订的书的图像时。文档图像分析和识别的许多复杂方法，例如：OCR和页面布局分析容易受到图像中几何失真的影响。因此，去除几何失真通常是与基于相机的文档图像识别相关的许多任务的关键且不可或缺的预处理步骤[1，2]。到目前为止，已经做出了许多努力来解决这个具有挑战性的问题。根据如何导出去扭曲映射，现有方法可以大致分为两类：基于图像的方法[3- 8]和基于模型的方法[9-19]。前者采用直接从图像视觉线索导出的局部[6 -8]或全局去扭曲变换[3-5]，例如弯曲的水平文本行或文档边界，以校正失真。这些方法通常可以产生具有拉直的文本行的期望结果，这是相当OCR友好的。然而，这些方法不能完全去除图像中的失真，因为没有引入3D形状模型来考虑物理页面失真。后来的工作更加关注基于模型的方法，并取得了一些重大进展[10，9，13，14，16，19，18]。基于模型的方法引入了一个三维页面表面模型连同一个相机模型来解释文档图像中的几何失真。这些方法的不同之处在于如何准确地恢复3D页面形状。一些早期的方法使用阴影恢复形状技术[16，19]来估计3D页面形状。这些方法理想地适用于扫描文档图像，其中在扫描过程中照明被很好地控制。然而，由于现实中环境光照极其复杂，它们通常无法拍摄到手持摄像机拍摄的图像。用于页面形状恢复的更稳健的方法是使用3D扫描仪[9，20，15]或从不同视点捕获的多个图像[11，18]。这些方法的优点是，它们可以被应用到文档图像与非常复杂的几何失真。然而，额外的硬件和图像的使用使得它们在研究中不那么有吸引力。相比之下，基于单个文档图像的方法利用所提取的视觉特征。基于向量场的3提示，例如弯曲的文本行，以恢复3D页面形状。代表作品有[10，13，17，14]。这些方法的一个缺点是它们必须首先检测和分割图像中的弯曲文本行。然而，这通常是相当具有挑战性的，特别是对于具有严重失真的文档图像。此外，这些方法也容易受到复杂页面布局的影响。对于具有稀疏文本行或大面积非文本内容的文档图像尤其如此。在本文中，我们提出了一种方法，利用其固有的向量场的几何校正的弯曲文档图像。通过假设页面形状是一个一般的圆柱表面，我们恢复相机和页面形状信息的参数，通过加权多数投票的向量场。最后，通过平坦化估计的页面表面来校正图像失真我们的方法是一种无段方法，并且不需要提取弯曲的水平文本行或文本块，由于许多具有挑战性的因素，这仍然是一个开放的问题[1，21]。因此，所提出的方法是非常强大的文档布局和各种类型的图像质量下降，通常发生在相机捕获的文档图像，包括严重的图像失真，不均匀的阴影，杂乱的背景和严重的图像模糊和噪声。图1示出了针对由手持相机捕获的单个失真文档图像的我们的方法的校正结果和重建的3D页面形状的示例。2方法2.1向量场和假设文档图像的矢量场基本上源自相机透视投影下的卷曲通常，文档内容，例如文本行、图形或表格沿一组直的平行基线排列和打印。这些基线通常是不可见的，但可以从文档的内容中推断出来[21]。一旦文档页面被卷曲并投影到图像平面上，下面的基线就被扭曲，产生变形的向量场，其在每个点处的向量给出弯曲基线的切线方向因此，文档图像的矢量场编码3D页面形状信息和相机的参数为了从向量场恢复3D页面形状信息，我们必须首先引入一些基本假设。首先，我们假设卷曲的页面形状是一般的圆柱形表面（GCS）。这一假设非常适合于对打开的厚装订书的页面形状进行建模，在以前的一些工作中也被采用，例如。，[14]。其次，我们要求GCS的刻度垂直于基线。这种正交性假设对模型参数的估计起着重要的作用，这将在后面说明第三，我们假设页面表面是光滑的。这一假设将有助于对显着的噪声和离群值的GCS的空间准线的估计。4G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘2.2估计模型参数从上述假设中，我们可以推导出页面形状与相机参数之间的重要关系。对于一般的圆柱面，其刻线是一组平行的直线。因此，在摄像机的透视投影之后，这些划线将相交于由（v〇，v1）表示的公共消失点。同样，根据柱面的性质，沿同一刻线的曲线基线的切向量彼此平行。因此，在透视投影之后，这些切向量将会聚在由（x，y）表示的公共消失点利用基线与刻线正交的假设，我们可以推导出每个（x，y）满足的消失线方程，即、v0x+v1y+f2= 0，（1）其中f是相机的焦距。图2示出了投影划线的消失点与基线切线上述等式给出了等式约束，即必须满足跨同一标尺的基线的切向量的消失点接下来，我们将利用这个方程来估计模型参数，并从文档图像的矢量场恢复3D页面形状图二、投影刻线的消失点与基线切线的几何关系向量场的估计文档图像的向量场由底层曲线基线的单位切向量因此，矢量场的估计实际上是恢复图像的局部方向这个问题已经在具有全局倾斜角的扫描文档图像的倾斜估计的上下文中被广泛研究[2]。在这项研究中，我们计算局部投影的图像在各个角度的Radon变换估计的局部方向。局部投影方差最大的角度作为局部方向的估计。基于向量场的5为了便于在每个像素的局部投影的有效计算这使得总的计算复杂度与图像的Radon变换相当。图3示出了通过计算每个前景边缘像素处虽然估计的向量场是稀疏和噪声，由于当地的投影，它可以很好地利用加权多数表决鲁棒估计模型参数。图三.通过计算局部投影的方差来估计图像的矢量场。(a)图像边缘图，（b）图像的估计向量场。投影线的消失点消失点（v0，v1）是投影线的公共交点我们使用Radon变换来检测图像中潜在的投影规则，然后将它们投票为消失点。对于弯曲的一般圆柱表面，其刻划是表面上唯一的线性结构。在透视投影之后，这些划线在图像中保持笔直。在文档图像中有许多相关的视觉线索可用于检测这些直线，例如，文档、文本块和插入照片的垂直边界或表格中的垂直线或字符的一些我们采用Radon变换的图像边缘图检测这些潜在的线。Radon变换是图像沿一组直线的线积分设R（ρ，θ）为图像边缘图的Radon变换，其中（ρ，θ）定义了一条直线，沿这条直线计算边缘图的线积分。我们计算线被投影的可能性作为沿ρ轴的Radon变换的局部方差，即、∫ρ+δL（ρ，θ）=ρ−δ （R（ρ~，θ）-m（ρ，θ））2dρ~，（2）其中δ是用于计算局部方差的窗口大小，m（ρ，θ）是沿ρ轴的拉东变换的局部均值，定义为：m（ρ，θ）= 1∫ρ+δ2δρ−δR（ρ~，θ）dρ~。（三）6G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘α∈[0，π），β∈[0，2π）采用球面上的加权多数表决算法来估计消失点。为此，我们首先引入球极投影下（v0，v1球极投影将球面上的一点映射到平面上的一个唯一点，如图4所示。将（v〇，v1）的对应球坐标表示为（α，β），其中α和β是两个角度，满足：v0=dtanα·cosβ,v1=dtanα·sinβ,2（四）其中d是球体的直径。使用球面坐标的好处是它们是有界的。因此，我们可以在给定的范围内将它们离散化，并根据预测裁决的可能性进行投票。见图4。球极投影将球体上的一点映射到平面上的唯一点。投票过程如下：对于由（ρ，θ）定义的每个候选投影规则，我们投票给满足投影规则的方程的所有（α，β）对，即、tanα· cos（β+θ）=ρ.（五）D投票权重由等式（1）中定义的（ρ，θ）的似然性给出（二）、实际上，Eq。(5)定义了从L（ρ，θ）到投票空间V（α，β）的变换。V（α，β）中具有最大投票的点最终被视为消失点的估计图5示出了用于估计投影划线的消失点的示例。一旦消失点的估计，我们实际上恢复所有的投影在图像中的统治。估计相机的焦距给定（v〇，v1）的估计，我们可以根据等式（1）投票相机的焦距f（一）.为此，我们首先对一系列投影的规则进行采样。对于每个投影的规则，我们随机选择几对前景点，比如p和q。然后切线的消失点可以很容易地计算为基于向量场的7图五、投影刻线消失点的估计（a）图3（a）中的图像边缘图上的Radon变换R（ρ，θ），（b）投影规则的似然性L（ρ，θ），（c）投票空间V（α，β），（d）估计的投影规则。p和q处的切线，即、.ρcosθ−ρ cosθx=p q q psin（θq−θp）ρpsinθq−ρqsinθpsin（θq−θp）、（6）其中（x，y）是切线的消失点，θp和θq分别是p和q处的切向量与xρp和ρq计算如下：ρp=ypcosθp−xp sinθpρq=yqcosθq−xq sinθq、（7）其中（xp，yp）和（xq，yq）分别是图像中p和q的坐标。图六、利用投影线点的多数表决法估计摄像机焦距(a)ρ的投票直方图，（b）切线的消失点和估计的消失线（蓝线）。我们在原点和消失线之间引入一个有符号距离ρ由方程式(1)定义为：xv0+yv1ρ= √。（八）v2+v20 1我们不直接投票给f，而是根据等式中的估计（x，y）投票给ρ（六）、投票ρ的一个好处是我们可以避免由y=8G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘（x，y）和（v0，v1）的符号翻转这个问题通常发生在（x，y）或（v0，v1）接近无穷大时。在这种情况下，小的误差可能导致（x，y）和（v0，v1）中的符号反转。焦距f最终计算为：.f=|ρ∗|.v2+v2，（9）0 1其中ρ*是得票最多的ρ图6示出了通过对来自投影划线的点进行多数表决来进行焦距估计的示例在图中，我们还显示了计算的切线消失点和估计的消失线。2.3页面表面单位切向量的估计一般的圆柱形表面通过移动直线（即，沿着称为准线的曲线。我们可以通过恢复空间基线的单位切向量来估计准线根据我们的假设，空间基线的单位切向量在同一标尺上由它们在图像中的消失点唯一确定此外，这些消失点满足方程（1）中定义的消失线方程（一）. 因此，我们可以用单个参数φ来参数化每个单位切向量，即，单位切向量与消失线L，如图7所示。见图7。准线的单位切向量。给定消失线L，单位切向量由L与单位切向量之间的夹角φ对应于每个预测的裁定的参数Φ通过裁定上的点的多数投票来估计。对于投影刻线上的每个点p，我们首先计算p处切线与消失线L的交点（x，y）（见图7）。然后计算φ并投票。由于稀疏且有噪声的向量场，估计的Φ对于页边距或照片区域中的一些投影的划线可能是有噪声的或甚至是错误的我们进一步在页面表面上使用平滑度假设来细化基于向量场的9..的估计。为此，我们对投影规则序列进行采样，k（1 ≤k≤n），其中n是采样规则的总数。对于每个预测的裁决，其对应的φk通过多数表决来估计。进一步将对应的最大投票表示为wk。页面表面的平滑度也意味着φ是平滑曲线。因此，我们可以通过求解以下1D优化问题来将平滑曲线拟合到估计的φkΣn二、2minφ（t）k=1. dφ（tk）。2019 - 04- 22 00：01：00 |φ（tk）− φk|）+ λ。d t2. 、（10）当rgτ（·）是在流函数中的一个分支时，定义为.gτ（x）=x2，如果x2≤ττ，否则.（十一）上述优化问题可以通过半二次分裂技术[23]有效地解决。图8（a）示出了单位切向量的估计的示例。在示例中，由于书表面沿着书脊线的非平滑性，我们手动将书脊点处的估计φ分成两部分并分别拟合它们。见图8。页面表面的3D重建。(a)拟合的Φ，（b）权重wk，（c）恢复的空间准线，（d）重建的3D页面表面。准线的恢复和三维页面重建一旦空间基线的单位切向量被估计，我们就可以在由相机的光学中心O和消失线L确定的平面上恢复三维准线。可以通过求解以下常微分方程来估计3D方向...d C（s）= t（s）。 d C（s）。d s.d s.、（十二）C（s0）=（u0，v0）其中C（s）是由s表示的3D定向参数，t（·）是直接由相应的角度φ确定的最小单位向量，（u0，v0）是在s 0处的给定边界条件。上述常微分方程10G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘见图9。用欧拉法求解常微分方程估计三维准线。欧拉方法迭代地构造折线来逼近解曲线。可以通过使用欧拉方法有效地求解图9示出了通过欧拉方法求解准线的过程。在估计准线之后，可以通过沿着划线方向移动准线在图8（c）和（d）中，我们示出了图3（a）中的图像的恢复的空间准线和重建的3D页面表面。一旦估计出3D页面表面，我们就可以通过网格变形来校正图像中的几何这可以通过将估计的3D页面表面填充到平面上以构建网格网格来完成在该过程中，可以进行平面上的点与图像之间的对应。然后通过三次样条拟合得到网格扭曲的去扭曲函数。3实验3.1实际拍摄图像为了评估我们的方法的性能，我们实现了一系列的实验，通过手持相机和智能手机相机的真实捕获的文档图像图10示出了通过使用智能手机相机从打开的书籍和文档捕获的若干代表性图像。文档图像具有复杂的页面布局，其中包含多个列和除文本行之外的各种类型的此外，文档由不同的语言组成，并且从不同的视点拍摄，因此具有不同程度的透视失真和散焦模糊。这些图像对于一些基于文本行的方法通常是具有挑战性的，例如，，[14]，因为在具有复杂布局的失真文档图像中精确提取弯曲基线是相当困难的我们的方法不需要弯曲的文本行的分割，从而是强大的复杂的页面布局。从结果中可以看出，我们的方法在这些图像上工作得很好。基于向量场的11见图10。实际捕获的文档图像的几何校正结果。从上到下：失真的文档图像、重建的3D页面表面、构建的网格和校正结果。我们还在DFKI数据集1上测试了我们的方法[24]。该数据集是专门设计用于评估弯曲文档图像校正方法图11示出了我们的方法在数据集上的校正结果的几个典型示例该数据集由从具有各种类型的文档内容的打开的书页捕获的二进制英文文档图像组成数据集中的所有文档页面都近似扭曲成一般的圆柱形，因此非常适合于我们的方法的评估。从实验结果可以看出，该方法能够很好地消除图像中的各种畸变，包括沿水平文本行的几何畸变和垂直方向的摄像机透视畸变。3.2我们与香港公司合作。Kimetal. 的方法2 [ 25] adop t s a smilar arcycylindrical page s h a p e as sum p t i onfor geometric rectification. 他们的方法依赖于连接组件分析技术，将字符分组为文本行和文本块。然后提取曲线基线以估计其3D页面模型的参数图12示出了我们的方法与它们的方法的校正结果的比较。 Kimetal.在给定的示例中，我们的工作并不像在S上那样主要是由于两个工作而完成的。 First，Kimetal. 该方法要求手动提供所需的数据。摄像机焦距的误差会导致较大的校正误差。第二，文本行和文本块的精确分割1这些数据可以从http：//staffhome中下载。ecm. uwa. edu。au/00082689/down-loads.html2可执行代码可从http://ispl.snu.ac.kr/bskim/DocumentDewarping/下载12G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘见图11。在DFKI数据集上的几何校正结果。从上到下：失真的文档图像、重建的3D页面表面、构建的网格和校正结果。了图 12个。与Kimetal一起使用的产品。sm e t o d [ 25 ]。（a）该指令包含多个累积量，（b）该X指令包含由Kimetal生成的X行。的方法，（c）K金属的直接结果。的方法，（d）该方法的校正结果，（e）该方法的校正结果。基于向量场的13图13.我们的方法与SEG方法[26]，SKEL方法[27]，CTM方法[28]和基于DFKI数据集的Snakes方法[29]的比较。(a)变形的文档图像，（b）SEG方法的结果，（c）SKEL方法的结果，（d）CTM方法的结果，（e）基于Snakes的方法的结果，（f）我们的方法的结果，（g）我们的方法的构造的网格。失真的文档图像是具有挑战性的。所提出的连通分量分析技术对语言敏感，并且通常无法用备用文本行记录图像，如从图中的结果可以看出的。3.3DFKI数据集我们还将我们的方法与DFKI数据集上的几种最先进的方法进行了比较，包括SEG方法[26]，SKEL方法[27]，CTM方法[28]和基于Snakes的方法[29]。SEG方法[26]分割图像中的每个单词，并将它们旋转到直线上以纠正局部倾斜。SKEL方法[27]提取文本图像的外骨架，然后将Bezier曲面拟合到整个页面以估计变形映射。CTM方法[28]通过形态学方法提取弯曲的水平文本行，并采用圆柱形模型来校正图像。基于Snakes的方法[29]采用耦合的snake模型来提取用于图像校正的弯曲文本基线。图13示出了我们的方法与四种方法的比较。我们还在图14中给出了五种方法的OCR准确度的箱形图。从实验结果可以看出，SEG方法和Snakes方法不能纠正图像中的非文本对象的失真，例如，、表格和公式。当图像包含大面积的非文本对象时，SKEL方法不能鲁棒地估计变形函数。在比较中，CTM方法和我们的方法工作得相当好。我们指出14G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘10.90.80.70.60.50.40.30.20.1原始SEGSKELCTM蛇我们的方法图14.在DFKI数据集上比较五种方法的OCR准确性。CTM方法的性能很大程度上取决于所提取的文本行的准确性。该方法中使用的形态学方法对结构元素的大小非常敏感，而结构元素的大小容易受到许多具有挑战性的因素的影响，包括图像分辨率和字体大小的变化、图像失真、图像模糊和文档布局。相比之下，我们的方法不依赖于文本行检测和分割。因此，它可以用于记录具有复杂页面布局和严重质量下降的图像。4结论在本文中，我们提出了一种无段的方法几何纠正的弯曲文档图像的手持摄像机捕获。通过假设弯曲的页面形状是一个一般的圆柱形表面，我们可以从一个单一的文档图像重建的基础3D页面形状，通过利用其固有的矢量场。与广泛使用的基于文本行的方法相比，例如，[14，25]，我们的方法不需要检测和分割弯曲的水平文本行或文本块，这仍然是一个开放的问题，特别是对于具有复杂页面布局的严重失真的文档图像。所提出的方法可以利用图像中各种类型的可用视觉线索进行3D页面形状恢复。因此，它可以应用于具有复杂的页面布局和严重的图像质量退化的文档图像。我们还实施了大量的实验，真实捕获的文档图像，以测试我们的方法的性能。确认我们感谢好心的区域主席和匿名评论者的宝贵意见。这项工作得到了中国国家自然科学基金91646207、国家科学基金IIS-1217302、IIS-1619078和陆军研究办公室ARO W 911 NF-16-1- 0138的部分支持。OCR精确度基于向量场的15引用1. 梁杰，Doermann，D.，Li，H.：基于相机的文本和文档分析：调查。国际文献分析与识别杂志7（2-3）（2005）842. Nagy，G.：pami文档图像分析二十年。IEEETransactionsonPatternAnalysandMachineIntellige22（1）（2000）383. Brown，M.S.，蔡耀忠：利用边界对印刷品图像进行几何和阴影校正。IEEE图像处理学报15（6）（2006）15444. Stamatopoulos，N.，加托斯湾，普拉蒂卡基斯岛Perantonis，S.J.：基于相机的文档图像的目标导向校正。 IEEE Transactions on Image Processing20（4）（2011）9105. 蔡耀春，Brown，M.S.：印刷材料图像的几何和阴影校正：使用边界的统一方法。 In ： ProceedingsoftheIEEECon-Fe-nceonComuterVisionandPatternRecognition. 第1卷。（2004年）2406. Ulges，A.，Lampert，C.H.，Breuel，T.M.：使用卷曲文本行的鲁棒估计的文档图像去扭曲。第八届D ocumentAnalysandRec gnitin国际会议论文集。（200 5）10017. 张志，Tan，C.L.：使用多项式回归校正扭曲的文本行。In：ICIP' 02。第3卷。（2002年）9778. 张志，Tan，C.L.：基于曲线文本行的回归校正文档图像扭曲。第七届文献分析与检索国际会议论文集（ICDAR）。（2003年）5899. Brown，M.S.，孙，M.，扬河，巴西-地云湖Seales，W.B.：从扭曲的文档中恢复 2d 内容。 IEEETransactionson PatternAnalysisandMachineIntellige nce29（11）（2007）190410. 曹，H.，丁某，Liu，C.：采用柱面模型对装订后的文档图像进行校正。国际计算机视觉会议（ICCV）论文集。（2003年）22811. Hyung，I.K.，金，J.，Nam，I.C.：从两个视图图像合成去扭曲和增强的文档图像。IEEE Transactions on Image Processing 18（7）（2009）155112. 梁杰，DeMenthon，D.，Doermann，D.：展平图像中弯曲的文档。IEEE计算机视觉与模式识别会议论文集（ Proceedings of IEEE Conference onComputer Vision and Pattern Recognition，CVPR）第2卷。（2005年）33813. 梁杰，DeMenthon，D.，Doermann，D.：摄像机捕获的文档图像的几何校正。IEEE模式分析与机器智能学报30（4）（20 08）59114. Meng，G.，Pan，C.，Xiang，S.，Duan，J.，Zheng，N.：弯曲文档图像的度量校正。IEEE Trans. on Pattern Analysis and Machine Intelligence34（4）（2012）70715. Meng，G.，Xiang，S.，Pan，C.，Zheng，N.：使用结构化光束的弯曲文档图像的主动校正国际计算机视觉杂志122（1）（2017）3416. Tan，C.L.张，L.，张志，夏T：通过三维形状建模恢复扭曲的文档图像。IEEE Transactions on Pattern Analysis and MachineIntelligE NCe28（2）（20 06）19517. 田，Y.，Narasimhan，S.：弯曲文档图像的校正和3d重建。在：IEEE计算机视觉和模式识别会议论文集（CVPR）。（2011年6月）37716G. 孟氏Y.Su，Y.Wu，S.Xiang和C.潘18. 你S Matsushita，Y.，Sinha，S.，Bou，Y.，Ikeuchi，K.：多视点矫正折叠的文件。 IEEE Transactions on Pattern Analysis and Machine Inteligence（2017）19. 张，L.，Yip，A.M.，Brown，M.S.，Tan，C.L.：使用图像修复和阴影恢复形状的统一文档恢复框架。模式识别42（11）（2009）296 120. Meng，G.，王玉，Qu，S.，Xiang，S.，Pan，C.：通过两个结构化光束对弯曲文档图像进行主动展平。 In ： Proceedings of the IEEE ConferenceonComputerVisionandPatter nRecognition. （2014）389021. Meng，G.，黄志，Song，Y.，Xiang，S.，Pan，C.：利用曲线投影从失真文档图像中提取虚拟基线。In：IEEE Interna- t ionalConfer enComuterVision.（2015）392522. 施耐德D. Block，M.，罗哈斯，R.：具有内插向量场的稳健文档扭曲。第九届国际文献检索与检索会议论文集。第1卷。（2007）11323. Nikolova，M.，Ng，M.K.：信号和图像处理的半二次最小化方法分析。SIAMJOUR NALONScienTi cCmuting27（3）（2005）93724. Shafait，F.，Breuel，T.M.：文件图像矫正比赛。 In：Proceedings第二届国际基于相机的文档分析与识别研讨会，Curitiba，B razil（Sep. 18125. Kim，B.S.，古永锵，Cho，N.I.：通过基于文本行的优化进行文档变形。模式识别48（11）（2015）360026. 加托斯湾，普拉蒂卡基斯岛Ntirogiannis，K.：基于分割的任意变形文档图像的恢复。 In ： The9thInternationalConferenceonDocumentAnalysisandRecognition，Curitiba，B razil（Sep. （2007年）98927. Masalovitch，A.，Mestetskiy，L.：使用连续骨架图像表示的文档图像去扭曲。上一篇：第二届国际基于摄像头的D ocumentAnalysisandRec gnition、Cur itiba、B razil研讨会（Sep. （2007年）4528. Fu，B.，吴，M.，Li，R.，李伟，Xu，Z.：一种基于模型的文本行检测的图书反翘方法。上一篇：第二届国际基于摄像机的文档分析和检索工作坊，Cur itiba，B razil（Sep. （2007年）6329. Bukhari，S.S.，Shafait，F.，Breuel，T.M.：使用耦合蛇的文档图像的去扭曲。在：第三届国际基于相机的文件分析和检索工作坊，B arcelona，Spanin（2009年7月）34-41

下载后可阅读完整内容，剩余1页未读，立即下载