基于表格线游程的选票图像表格域提取方法

需积分: 43 20 下载量 105 浏览量 更新于2024-08-10 收藏 1.17MB PDF 举报
“表格域提取-计算机辅助几何造型技术_莫蓉” 本文介绍了一种基于表格线游程的选票图像几何结构识别方法,主要用于计算机辅助几何造型技术中对表格数据的处理。核心在于表格线的检测、噪声去除和表格域的提取。 1. 表格线检测: - 表格线检测主要依赖于表格线游程的合并。表格线游程是图像中表格线的连续部分,通过计算两条表格线游程之间的同线距离 rd 来判断它们是否属于同一表格线。如果同线距离 rd 小于预设阈值 dT(本例中为5),则认为这两条线游程是同一线的一部分。 - 对于表格横线的检测,首先初始化 LineDetail 数组和 lengthR 数组,然后自下而上搜索图像,找到表格横线的起始游程,并将其填充到 LineDetail 数组中,记录其长度和位置信息。 - 接下来,继续检查后续的表格线游程,如果它们与已有的游程同线,就合并到当前表格横线中;否则,视为新的表格横线并重复上述步骤。 2. 噪声去除与表格线补全: - 由于字符游程可能会导致噪声表格线,可以通过设定表格线长度域值 llT(例如最大长度的50%)来区分真实的表格线和噪声。较长的线条被认为是真实的表格线,而较短的线条则被视为噪声并被去除。 - 基于选票表格的规范性,通过一致性(如长度一致性)来补全断裂的表格线,确保表格结构的完整性。 3. 表格域提取: - 表格域是由表格横线和竖线交叉形成的区域。每个表格域由上、下两条横线(h tL 和 h bL)以及左、右两条竖线(v lL 和 v rL)定义。 - 自上而下搜索选票图像,根据提取到的表格线,找出相邻的横线和竖线,从而识别出表格域。 这种方法适用于选票图像的处理,但其基本原理也可以应用于其他类型的表格图像分析,例如文档图像分析、表格数据提取等领域。通过精准地提取表格结构,可以为进一步的图像分析和数据处理提供基础,比如文本识别、数据分析等。实验结果证明了该方法在快速有效地识别选票图像的几何结构方面具有良好的性能。