回归-聚类联合框架在手写文本行提取中的应用
需积分: 10 82 浏览量
更新于2024-09-12
收藏 2.55MB PDF 举报
"回归_聚类联合框架下的手写文本行提取_朱健菲",是一篇关于手写文本行提取技术的研究论文,由朱健菲、应自炉和陈鹏飞共同撰写,发表在《中国图象图形学报》2018年第23卷第8期,文章探讨了在无约束手写文本图像处理中的文本行提取问题,通过结合回归和聚类算法来解决文本行的倾斜、弯曲、交叉和粘连等难题。
在文档图像处理领域,手写文本行提取是至关重要的一步,它直接影响到后续的识别和分析效果。对于无约束手写文本,由于其自由度高,图像中的文本行可能存在各种复杂情况,传统的几何分割和简单的聚类方法往往难以准确地分离文本行。为了解决这些问题,作者提出了一种创新的回归-聚类联合框架。
首先,该方法运用各向异性高斯滤波器组对手写文本图像进行多尺度、多方向的分析,以增强文本脊形结构。通过拖尾效应,可以有效检测和提取文本行的主要区域,并对其进行骨架化处理,生成文本行的回归模型。这个回归模型能够描述文本行的基本形状和位置信息。
接下来,为了进一步精细化处理,研究采用连通域作为基本图像单元构建超像素表示。通过建立像素-超像素-文本行关联的层级随机场模型,利用能量函数优化来实现超像素的聚类,并同时为每个超像素分配对应的文本行标签。这样,可以更精确地识别和分割文本行。
在处理粘连字符问题时,论文提出了基于回归线的k-means聚类算法。这个算法利用回归模型作为引导,将粘连字符像素进行聚类,从而实现字符的分割和归属文本行的确定。这种方法有效地解决了字符粘连带来的识别难题。
最终,通过利用文本行标签开关,可以控制文本行像素的显示和定向提取,无需依赖传统的几何分割。这种策略简化了处理流程,提高了提取效率。
在HIT-MW脱机手写中文文档数据集上的实验结果显示,该方法的检测率(Detection Rate, DR)达到了99.83%,表明其在实际应用中具有极高的准确性和实用性。该研究得到了国家自然科学基金项目的资助,为手写文本处理领域的进步提供了新的理论和技术支持。
2022-09-23 上传
2022-07-14 上传
2022-07-15 上传
2022-07-13 上传
卫星辰
- 粉丝: 0
- 资源: 7
最新资源
- Python库 | python-gitlab-0.14.tar.gz
- bmed-4460-6460:生物图像分析课程的源代码(BMED 44606460)
- rpgit-system:rpgit系统
- ListBox.zip源码Labview个人项目资料程序资源下载
- sympathetic-synth:交感合成器系统Mk1
- launch-extension-context-data-tools:提供操作和一些工具,使您可以使用contextData变量进行跟踪
- Look4:基于MVI,附近连接API和Hilt的约会应用
- TWB:TWB 网络应用程序
- fps沙箱
- Python库 | python-ftx-0.1.0.tar.gz
- GenGen:通用的世代系统
- 感言
- lunchlady:一个基于NodeJS的愚蠢,简单的无后端CMS
- 资源fastjson-get-post.zip
- sssnap-api:已弃用 - 用于 sssnap 的 REST JSON API
- Excel模板开票申请单模板.zip