没有合适的资源?快使用搜索试试~ 我知道了~
首页单向准连通表格线检测算法
"单向准连通的表格线检测算法_彭绍湖.pdf" 在表格处理领域,表格线检测是至关重要的一步,它对于表格的解析和内容提取具有决定性作用。传统的表格线检测方法往往面临诸多挑战,例如表格框线的抖动、破裂、断裂以及字符与表线粘连等问题,这些问题可能导致表格结构识别的不准确。彭绍湖、郑胜林、潘保昌和廖崇生等人针对这些挑战,提出了一种基于单向准连通的表格线检测算法。 该算法的核心在于将表格线检测与处理相结合,首先通过检测算法获取初步的表格线,然后利用单向准连通性原则进行优化。在检测阶段,算法能够有效地处理倾斜、破裂和粘连的框线,这主要得益于单向准连通的概念。单向准连通性是指在一定方向上,即使线条存在轻微的不连续或断裂,也能被识别为同一连通部分,从而减少因线条抖动导致的误判。 在处理阶段,算法对检测出的线条进行连接和筛选,通过智能的连接策略,将断裂的线条重新组合,确保表格的完整性和准确性。这种方法可以有效地解决因各种原因造成的表格线断裂问题,提高表格结构的识别率。 实际应用中,研究人员通过大量的实验验证了该算法的有效性。实验结果表明,该单向准连通的表格线检测算法在处理表格线的断裂、抖动和粘连等问题时,能取得良好的检测效果,提高了表格解析的精度和效率。这对于自动化表格处理系统,尤其是文档理解、数据分析和信息提取等领域具有重要的实用价值。 关键词:表格线检测,直线检测,表格处理,图像处理,模式识别,单向准连通,框线断裂,字符粘连
资源详情
资源推荐
第
7 2
卷 第
5
期
2
0 0
6
年
9
月
微 计 算 机 应 用
M
IC R〔
犯
OMU [ P
IE
RA P P LI C A I TO NS
V
o
l
.
2
7
N
o
.
5
S e
t
P
.
2 0 0 6
单 向
准
连通 的表 格 线检
测
算
法
彭绍湖
郑胜
林 潘
保
昌
(
广东工业大学信
息
士
程
学院 广州
廖 崇
生
5 1 0 6 4 0
)
摘 要
:
针
对
表格框线存在倾抖
、
破裂
、
断裂及 字符
与
表线粘连等情
况
,
对表格框
线的
检
浏 方 法
进行
了
深入研
究
。
采
用
了
表格框 线检
浏 与处
理相
结
合
的 方法
获取表线
。
在表格框线检
浏
中
,
提
出
基
于
单
向
准连通
的
检
浏 方法
,
有
效
地
克
服
了
框线的倾
料
、
破裂及
拈连
等情
况
;
在表格框线
的 处
理 中
,
采
用
对检
浏
线
的
连接和筛选
的 方法
,
有效 解
决 了
表格框线
断
裂
的 问
题
。
通
过
大 1 的
实脸
,
表
明该 方 法 能
取得较好
的
检
浏
效果
。
关
键
词
:
裹格线检测 直线检测 衰格处理 圈像处理 模式识别
A S
y
s
t
el .
of
T
a
b l
e
L i
n e
乃陷伙
,
i
gn
t
h
a
t
B
别犯
皿
t
b
e
o
匕
e
一
w
ay an
d
Q
alls
i G O’ 山
ce
t
i
o n
P E N G Sh
a
o
hu
,
Z H E N G S h ,
昭
li
n
,
P A N E
匕
oc
ha gn
,
L IA O Ch
o n
g
s
he gn
(
T h
e
d
e
匹
r
匕n
e
幻t
o
f i
n
f
o r
m
a
t
i
o n e n
团
n
ee
r
,
G
u
an 如
。
飞
U
b
i
ve
isr
t
y
of
T
ce h
n o
l
o
g y
,
G
u a
吃
z
h
o u
,
5 1 0 6 40
,
hC
i
an
)
A
加
t
门d
:
A im i
吧
at
t
h
e
ca
s
e
t
h
a
t t
ha
at b l
e
l
i
n e
rr 以 y
b
e s
l
o
p
吨
,
b
r
ea
拓
飞
,
ur
p
t
iur
飞
,
or
e o n
g
l
u t
i
an
t
i
呀 诫
t
h
t
h
e
wo
r
d
s
,
w
e
s
t
du
y
t
h
e
me
t
h
o
d
o
f
t
h
e
l i
ne
det
ce
t
i
飞
ca
r e
f
u
l
l
叭
扮
u
s
i
gn
t
he
m
e t
h
do
t
h
a
t
e o
m
b
ine
li
ne
,
d
e
t
ce
t
i
雌
a
n
d
p
cor
e s s
i
眼
t o
-
g
e
t
h
e r
,
w
e
ca
n
d
e
l
e
t
e
t
h
e t a
ble l i
esn
e
f f
e e
t
i
v
el
y
.
I
n
t
h
e
p
or
e e s s
of
l
ien
d et
ec
t
i
雌
,
we
P
or
op
s e a
me
t
h
o
d
t
ha
t
ha
s e o n
O
n
e
一
wa
y
a
dn 明
a s
i
co
mecr
t
i
on
,
w h i
e
h
e
an vo
e
cr
ome
t
h
e
P
or
b
l
em
t
h
a t t
he
at b l
e
l
ien
1
5
s
l
o
P
i
gn
,
b
r
ea
k
ign
,
co
呢
l ut i
an
t
i
o n
,
e
ff
e e
t
i
ve
l
y
.
T h
e
p
or
b l
enr
t
ha
t
t
h
e
Ii
ne
1
5
ur
p
ut
r
i
昭
can
be
so
l
v
de
e
f
丘
又
t
i
ve
l
y
b
y
t
h
e
me
t
h
do
of
Ii
n
e
s
cconne
t
i
o n a
dn
Ii
n
e s
s e
l
e e
t
i
o
n
w h
e n
P
r o e e s s
t
h
e
li
n
e s
.
A
dn
t
h
or
u
g
h
t
he
s e
me
t
ho
d
s
,
w
e e a
n
d
e t e
e
t
a
n
d d
e
l
e
t
e
t
he
t
a
b l
e
li
n e
e
f fe
e
t
i
v e
l
y
i
n
d if
-
f
e r e
n t
e a s e s
.
I刀
t
s
o
f
e
即
e r
i
e n e e s
h
a v
e
s
h
o
wn
t
h
a
t t
h
e s
y
s
t
em
e a
n
arn
k
e v e r
y g
o o
d d
e
t
e e
t
i
飞
r e s
u
l
t
.
旋州
o
n
七
:
t
a
b l
e
li
n e
d
e
t
ec
t
i
馆
,
li
n
e
d
e
t e
e
t
i
n
g
,
t
a
bl
e
p
or
e e s s
i
呢
,
i
am
g
e
p
or
e e s s
i
吃
,
mo
d
e
l
r e e
o
g
n
i
t
i
o n
1
引言
在表格
的
自动 阅读 中
,
表格框线
的
检
测
十分重要
,
检测结
果
直接影响计算机对表格
的
正确识别
。
由
于
表格在扫描
录
人
的过
程中会出现线
的
倾斜
、
断裂
、
破 裂
以及
字符与表格线粘连
的
情
况
,
这给表格线的检测带来很大 的
困
难
。
本文针对表格框线检 测中存在 的
不
同情况
,
提出 了单向
准
连通
的算法对 表格框线进行检测
,
并对检测线
进
行处理
,
最
终能有效获取表格线 的信息
,
得 到正确
的
检 测结果
。
这种方
法不
仅能获得直线 的端点
,
表格线 的具体位置
,
而且能准确得
到直线
的
长度
,
粗度
和
斜率
,
对
于
表格线
出
现 中间破裂
,
断裂
,
倾斜
,
及字符与表格线粘
连
等情况也能进行
正
确的检测
。
2
线的检
测
—
单 向
准
连通 的方
法
对表格线进 行检 测
,
本 文提 出
一
种单 向准连 通 的方法
。
单
向是
指 采取从左
到
右或从
上
到
下的
方向性检测
,
连通 是指
本
文于
2 0 0 5 一 1 1一 1 1
收到
。
在跟踪检测 时采用连通的方式
,
准连通 是指对连通 的
要
求降
低
,
即
允许连通点之间存在一定 的距离
。
检测时 分为两个 步
骤
,
即
先检测直线的起始游程段
,
再根据检测到
的
游程段进行
直线的跟踪检测
。
由
于
竖向表格线 的检测与横向表格线
的
检
测原理一样
,
这里
只
详细论述横向表格线的检测方法
。
对
于
一条横向直线
,
可
以
看成是由长度较短 的一段段纵
向游程组成
的
。
这种单 向准连通的检测方法正是基于这
两
方
面
的
考虑
,
即
先获取横向表格线起始 的游程段
,
然后 由起始游
程段 向
后
跟踪
,
将横向表格线检 测 出来
。
横向直线检
测
示 意
图如图
1
所示
。
2
.
1
横
向
直线起始游程段的检
测
为
了
检测横向的表格 线
,
必须先检测横 向表 格线 的起 始
游程段
,
再
根
据游程段的长短判断是
否
进行横向检测
。
若
一
幅表
格图像是二值图像
,
其大小为
m
x
n,
设
F一
if(
,
j
)
是一个表格图象
的矩阵点集
,
i~ 1
,
2
,
…
,
m
;
j
~ 1
,
2
,
…
,
n
,
点
i(
,
j)
为一个像素
的
对
应
坐
标
,
f ( i
,
j
)
为对应
坐
标的像素值
,
f ( i
,
i
) e
{
o
,
l
}
。
“
o
, ,
表
示
白
下载后可阅读完整内容,剩余3页未读,立即下载
qingfenglu
- 粉丝: 21
- 资源: 16
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- WebLogic集群配置与管理实战指南
- AIX5.3上安装Weblogic 9.2详细步骤
- 面向对象编程模拟试题详解与解析
- Flex+FMS2.0中文教程:开发流媒体应用的实践指南
- PID调节深入解析:从入门到精通
- 数字水印技术:保护版权的新防线
- 8位数码管显示24小时制数字电子钟程序设计
- Mhdd免费版详细使用教程:硬盘检测与坏道屏蔽
- 操作系统期末复习指南:进程、线程与系统调用详解
- Cognos8性能优化指南:软件参数与报表设计调优
- Cognos8开发入门:从Transformer到ReportStudio
- Cisco 6509交换机配置全面指南
- C#入门:XML基础教程与实例解析
- Matlab振动分析详解:从单自由度到6自由度模型
- Eclipse JDT中的ASTParser详解与核心类介绍
- Java程序员必备资源网站大全
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功