自然场景文本检测:基于笔画角度与宽度特征的方法

需积分: 10 1 下载量 52 浏览量 更新于2024-09-09 收藏 1.31MB PDF 举报
"这篇论文提出了一种新的自然场景文本检测方法,着重利用了笔画角度变换和宽度特征。针对光照不均匀和复杂背景导致的文本漏检和错检问题,该方法通过分析文本与非文本区域在笔画稳定性的差异,提出了两个关键特征:笔画外边界优劣角变换次数和增强笔画支持像素面积比。前者统计笔画轮廓角度变换的频率,后者则评估笔画宽度的稳定性。此外,结合多通道最大稳定极值区域(MSER)检测技术,该方法能有效地合并候选区域,并利用支持向量机进行文本和非文本区域的分类。在ICDAR2015数据集上的实验结果显示,此方法的精确率和召回率分别达到了79.3%和72.8%,有效缓解了光照不均和复杂背景对文本检测的影响。" 这篇研究论文由陈硕、郑建彬、詹恩奇和汪阳共同完成,他们都是在模式识别、图像处理、嵌入式系统、信号处理等领域有着深入研究的专业人士。他们的工作得到了国家自然科学基金的支持。论文的核心是提出了一种新的自然场景文本检测策略,旨在解决由于光照条件和背景复杂性导致的文本检测挑战。 首先,他们观察到文本的笔画角度和宽度相对稳定,而这些特性在非文本区域通常不具备。因此,他们设计了两个特征来捕捉这些差异:一是笔画外边界优劣角变换次数,它通过分段统计文本边缘的角度变化来体现笔画的结构稳定性;二是增强笔画支持像素面积比,该特征计算出笔画宽度稳定区域占总面积的比例,从而反映笔画宽度的不变性。 接下来,为了提高文本检测的准确性,研究人员采用了多通道MSER检测技术,该技术能有效地检测出文本候选区域。然后,他们提取这些候选区域的笔画特征和纹理特征,最后利用支持向量机(SVM)进行分类,区分文本和非文本区域。 在ICDAR2015这个标准的数据集上,该方法的性能得到了验证。实验结果表明,算法的精确度和召回率分别达到了79.3%和72.8%,表明这种方法在一定程度上成功地克服了光照不均匀和复杂背景对文本检测的负面影响,提高了检测的准确性和鲁棒性。这种方法对于自然场景文本检测的改进具有重要意义,特别是在实际应用中如自动驾驶、智能监控等领域,能够提供更可靠的文本信息识别。