无分割手写汉字检测:两方向动态时间规整方法

需积分: 11 0 下载量 153 浏览量 更新于2024-08-11 收藏 1.44MB PDF 举报
"基于两方向动态时间规整的无分割手写汉字检测 (2016年) - 中文文本布局复杂,手写汉字检测挑战 - 使用SIFT定位候选关键点 - 基于关键点和汉字大小确定候选字符位置 - 采用双向DTW算法筛选字符 - 无需文本分割,提高检测准确性 - 对比传统DTW方法有优势" 这篇论文详细探讨了在复杂中文文本背景下无分割手写汉字检测的问题。由于中文文本的布局复杂性、汉字种类繁多以及手写体的随意性,手写汉字检测成为了一个极具挑战性的任务。为了解决这一难题,研究者提出了一种创新的无分割手写中文文档字符检测方法。 该方法的核心在于利用尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)算法来定位文本中的候选关键点。SIFT是一种强大的图像特征提取方法,能够有效识别不同尺度和旋转下的关键点,即使在光照变化和部分遮挡的情况下也能保持稳定。通过SIFT,论文中的方法可以找到潜在的字符边界。 接下来,研究人员结合关键点的位置信息和预设的待查询汉字大小,来确定候选字符的精确位置。这种方法避免了对文本进行字符分割的步骤,减少了处理时间和复杂性。 在确定候选字符位置后,论文引入了双向动态时间规整(Two-directional Dynamic Time Warping, DTW)算法进行筛选。DTW是一种衡量两个序列相似度的经典算法,尤其适用于时间序列的比较,如语音识别和笔迹识别。在本文中,双方向的DTW意味着同时从水平和垂直两个方向对字符进行匹配,提高了检测的准确性和鲁棒性。 实验结果显示,这种基于双向DTW的无分割检测方法能够在不切割文本为单个字符的情况下,有效地找到待查询的汉字,且其性能优于传统的仅使用DTW的字符检测技术。这种方法的应用对于手写文档分析、信息检索等领域具有重要意义,特别是在处理大量手写中文文档时,能够显著提升效率和准确性。 此外,这篇论文还提及了相关的基金项目支持,包括国家科技支撑计划和上海市科委资助的项目,以及作者的研究方向和背景信息。这些信息表明,这项工作是在图像处理和模式识别领域具有深厚基础的科研团队合作完成的,具有较高的学术价值和实际应用潜力。