回归-聚类联合框架在手写文本行提取中的应用

需积分: 10 82 浏览量更新于2024-09-12 收藏 2.55MB PDF 举报

"回归_聚类联合框架下的手写文本行提取_朱健菲"，是一篇关于手写文本行提取技术的研究论文，由朱健菲、应自炉和陈鹏飞共同撰写，发表在《中国图象图形学报》2018年第23卷第8期，文章探讨了在无约束手写文本图像处理中的文本行提取问题，通过结合回归和聚类算法来解决文本行的倾斜、弯曲、交叉和粘连等难题。在文档图像处理领域，手写文本行提取是至关重要的一步，它直接影响到后续的识别和分析效果。对于无约束手写文本，由于其自由度高，图像中的文本行可能存在各种复杂情况，传统的几何分割和简单的聚类方法往往难以准确地分离文本行。为了解决这些问题，作者提出了一种创新的回归-聚类联合框架。首先，该方法运用各向异性高斯滤波器组对手写文本图像进行多尺度、多方向的分析，以增强文本脊形结构。通过拖尾效应，可以有效检测和提取文本行的主要区域，并对其进行骨架化处理，生成文本行的回归模型。这个回归模型能够描述文本行的基本形状和位置信息。接下来，为了进一步精细化处理，研究采用连通域作为基本图像单元构建超像素表示。通过建立像素-超像素-文本行关联的层级随机场模型，利用能量函数优化来实现超像素的聚类，并同时为每个超像素分配对应的文本行标签。这样，可以更精确地识别和分割文本行。在处理粘连字符问题时，论文提出了基于回归线的k-means聚类算法。这个算法利用回归模型作为引导，将粘连字符像素进行聚类，从而实现字符的分割和归属文本行的确定。这种方法有效地解决了字符粘连带来的识别难题。最终，通过利用文本行标签开关，可以控制文本行像素的显示和定向提取，无需依赖传统的几何分割。这种策略简化了处理流程，提高了提取效率。在HIT-MW脱机手写中文文档数据集上的实验结果显示，该方法的检测率（Detection Rate, DR）达到了99.83%，表明其在实际应用中具有极高的准确性和实用性。该研究得到了国家自然科学基金项目的资助，为手写文本处理领域的进步提供了新的理论和技术支持。

卫星辰

粉丝: 0
资源: 7

回归-聚类联合框架在手写文本行提取中的应用

CollectAnaly.zip_layer cluster_聚类 运行_聚类分析_聚类分析 matlab_聚类结果分析

数据集.rar_uci_uci聚类数据_聚类_聚类 数据集_聚类数据集

聚类指标小结.rar_指标评价_聚类_聚类评价_聚类评价指标_聚类评分指标

PXJLmain.zip_聚类_聚类分析_聚类距离_谱系聚类_谱系聚类法

特征提取；聚类.rar_数据降维_特征提取_聚类_聚类提取特征_降维

juleipingjia.rar_内部评价指标_聚类内部指标_聚类方法评价_聚类评价指标_聚类质量

matlab.rar_MATLAB算法_matlab，聚类_聚类MATLAB_聚类‘_聚类算法

kmeans.rar_kmeans 聚类_kmeans聚类_改进Kmeans聚类_聚类_聚类改进

t.rar_EYJQ_jet7i7_聚类_聚类分析_聚类分析 t值

聚类分析.rar_MATLAB 聚类_matlab聚类_数据统计_聚类_聚类分析

最新资源

CollectAnaly.zip_layer cluster_聚类运行_聚类分析_聚类分析 matlab_聚类结果分析

数据集.rar_uci_uci聚类数据_聚类_聚类数据集_聚类数据集