回归-聚类联合框架在手写文本行提取中的应用

需积分: 10 0 下载量 82 浏览量 更新于2024-09-12 收藏 2.55MB PDF 举报
"回归_聚类联合框架下的手写文本行提取_朱健菲",是一篇关于手写文本行提取技术的研究论文,由朱健菲、应自炉和陈鹏飞共同撰写,发表在《中国图象图形学报》2018年第23卷第8期,文章探讨了在无约束手写文本图像处理中的文本行提取问题,通过结合回归和聚类算法来解决文本行的倾斜、弯曲、交叉和粘连等难题。 在文档图像处理领域,手写文本行提取是至关重要的一步,它直接影响到后续的识别和分析效果。对于无约束手写文本,由于其自由度高,图像中的文本行可能存在各种复杂情况,传统的几何分割和简单的聚类方法往往难以准确地分离文本行。为了解决这些问题,作者提出了一种创新的回归-聚类联合框架。 首先,该方法运用各向异性高斯滤波器组对手写文本图像进行多尺度、多方向的分析,以增强文本脊形结构。通过拖尾效应,可以有效检测和提取文本行的主要区域,并对其进行骨架化处理,生成文本行的回归模型。这个回归模型能够描述文本行的基本形状和位置信息。 接下来,为了进一步精细化处理,研究采用连通域作为基本图像单元构建超像素表示。通过建立像素-超像素-文本行关联的层级随机场模型,利用能量函数优化来实现超像素的聚类,并同时为每个超像素分配对应的文本行标签。这样,可以更精确地识别和分割文本行。 在处理粘连字符问题时,论文提出了基于回归线的k-means聚类算法。这个算法利用回归模型作为引导,将粘连字符像素进行聚类,从而实现字符的分割和归属文本行的确定。这种方法有效地解决了字符粘连带来的识别难题。 最终,通过利用文本行标签开关,可以控制文本行像素的显示和定向提取,无需依赖传统的几何分割。这种策略简化了处理流程,提高了提取效率。 在HIT-MW脱机手写中文文档数据集上的实验结果显示,该方法的检测率(Detection Rate, DR)达到了99.83%,表明其在实际应用中具有极高的准确性和实用性。该研究得到了国家自然科学基金项目的资助,为手写文本处理领域的进步提供了新的理论和技术支持。