无分割手写汉字检测：两方向动态时间规整方法

需积分: 11 153 浏览量更新于2024-08-11 收藏 1.44MB PDF 举报

"基于两方向动态时间规整的无分割手写汉字检测 (2016年) - 中文文本布局复杂，手写汉字检测挑战 - 使用SIFT定位候选关键点 - 基于关键点和汉字大小确定候选字符位置 - 采用双向DTW算法筛选字符 - 无需文本分割，提高检测准确性 - 对比传统DTW方法有优势" 这篇论文详细探讨了在复杂中文文本背景下无分割手写汉字检测的问题。由于中文文本的布局复杂性、汉字种类繁多以及手写体的随意性，手写汉字检测成为了一个极具挑战性的任务。为了解决这一难题，研究者提出了一种创新的无分割手写中文文档字符检测方法。该方法的核心在于利用尺度不变特征变换（Scale-Invariant Feature Transform, SIFT）算法来定位文本中的候选关键点。SIFT是一种强大的图像特征提取方法，能够有效识别不同尺度和旋转下的关键点，即使在光照变化和部分遮挡的情况下也能保持稳定。通过SIFT，论文中的方法可以找到潜在的字符边界。接下来，研究人员结合关键点的位置信息和预设的待查询汉字大小，来确定候选字符的精确位置。这种方法避免了对文本进行字符分割的步骤，减少了处理时间和复杂性。在确定候选字符位置后，论文引入了双向动态时间规整（Two-directional Dynamic Time Warping, DTW）算法进行筛选。DTW是一种衡量两个序列相似度的经典算法，尤其适用于时间序列的比较，如语音识别和笔迹识别。在本文中，双方向的DTW意味着同时从水平和垂直两个方向对字符进行匹配，提高了检测的准确性和鲁棒性。实验结果显示，这种基于双向DTW的无分割检测方法能够在不切割文本为单个字符的情况下，有效地找到待查询的汉字，且其性能优于传统的仅使用DTW的字符检测技术。这种方法的应用对于手写文档分析、信息检索等领域具有重要意义，特别是在处理大量手写中文文档时，能够显著提升效率和准确性。此外，这篇论文还提及了相关的基金项目支持，包括国家科技支撑计划和上海市科委资助的项目，以及作者的研究方向和背景信息。这些信息表明，这项工作是在图像处理和模式识别领域具有深厚基础的科研团队合作完成的，具有较高的学术价值和实际应用潜力。

收稿日期：２０１５０９２４修回日期：２０１５１１１２　　基金项目：国家科技支撑计划资助项目（２０１１ＢＡＫ０５Ｂ０４）；上海市科委资助项目

（

１４ＤＺ２２６０８００）

作者简介：黄志敏（１９６０），男，广东梅州人，副研究员，主要研究方向为图像处理及模式识别（ｍｏｕｓｅ９０２＠１６３．ｃｏｍ）；姚舜奕（１９９０），男，江苏

盐城人，硕士研究生，主要研究方向为图像处理及模式识别；熊玉洁（１９８９），男，湖南湘乡人，博士研究生，主要研究方向为模式识别与智能系统．

基于两方向动态时间规整的无分割手写汉字检测



黄志敏

１

，姚舜奕

２

，熊玉洁

２

（１．公安部第三研究所，上海２０００３１；２．华东师范大学上海市多维度信息处理重点实验室，上海２００２４１）

摘　要：中文文本布局复杂、汉字种类多、书写随意性大，因而手写汉字检测是一个很有挑战的问题。针对上述

问题，提出了一种无分割的手写中文文档字符检测的方法。该方法用

ＳＩＦＴ定位文本中候选关键点，然后基于关

键点位置和待查询汉字大小来确定候选字符的位置，最后用两个方向动态时间规整（ｄｙｎａｍｉｃｔｉｍｅｗａｒｐｉｎｇ，

ＤＴＷ）算法来筛选候选字符。实验结果表明，该方法能够在无须将文本分割为字符的情况下准确找到待查询的

汉字，并且优于传统的基于ＤＴＷ字符检测方法。

关键词：手写汉字检测；无分割；ＳＩＦＴ；动态时间规整

中图分类号：ＴＰ３９１．４　　文献标志码：Ａ　　文章编号：１００１３６９５（２０１６）１１３４９９０４

ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１３６９５．２０１６．１１．０６６

ＴｗｏｄｉｒｅｃｔｉｏｎａｌｄｙｎａｍｉｃｔｉｍｅｗａｒｐｉｎｇｂａｓｅｄＣｈｉｎｅｓｅ

ｈａｎｄｗｒｉｔｔｅｎｓｅｇｍｅｎｔａｔｉｏｎｆｒｅｅｗｏｒｄｓｐｏｔｔｉｎｇ

ＨｕａｎｇＺｈｉｍｉｎ

１

，ＹａｏＳｈｕｎｙｉ

２

，ＸｉｏｎｇＹｕｊｉｅ

２

（１．ＴｈｅＴｈｉｒｄＲｅｓｅａｒｃｈＩｎｓｔｉｔｕｔｅｏｆＭｉｎｉｓｔｒｙｏｆＰｕｂｌｉｃＳｅｃｕｒｉｔｙ，Ｓｈａｎｇｈａｉ２０００３１，Ｃｈｉｎａ；２．ＳｈａｎｇｈａｉＫｅｙＬａｂｏｒａｔｏｒｙｏｆＭｕｌｔｉｄｉｍｅｎｓｉｏｎａｌＩｎ

ｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇ，ＥａｓｔＣｈｉｎａＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｓｈａｎｇｈａｉ２００２４１，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＬａｒｇｅｖａｒｉｅｔｙｏｆＣｈｉｎｅｓｅｃｈａｒａｃｔｅｒｓａｎｄｈａｎｄｗｒｉｔｉｎｇｓｔｙｌｅｓａｎｄｔｈｅｃｏｍｐｌｅｘｉｔｙｏｆＣｈｉｎｅｓｅｈａｎｄｗｒｉｔｔｅｎｄｏｃｕｍｅｎｔｓ

ｌａｙｏｕｔｌｅａｄａｈｕｇｅｃｈａｌｌｅｎｇｉｎｇｆｏｒｔｈｅＣｈｉｎｅｓｅｈａｎｄｗｒｉｔｉｎｇｗｏｒｄｓｐｏｔｔｉｎｇ．Ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｓｅｇｍｅｎｔａｔｉｏｎｆｒｅｅｗｏｒｄｓｐｏｔ

ｔｉｎｇｍｅｔｈｏｄｆｏｒＣｈｉｎｅｓｅｈａｎｄｗｒｉｔｔｅｎｄｏｃｕｍｅｎｔｓ．Ｆｉｒｓｔｌｙ，ｔｈｅｍｅｔｈｏｄｕｓｅｄｔｈｅＳＩＦＴｋｅｙｐｏｉｎｔｄｅｔｅｃｔｏｒｔｏｌｏｃａｔｅｔｈｅｃａｎｄｉｄａｔｅ

ｋｅｙｐｏｉｎｔｓｉｎｄｏｃｕｍｅｎｔｉｍａｇｅｓ．Ｔｈｅｎｉｔｄｅｔｅｒｍｉｎｅｄｔｈｅｃａｎｄｉｄａｔｅｃｈａｒａｃｔｅｒｒｅｇｉｏｎｓｂｙｔｈｅｋｅｙｐｏｉｎｔｓ

’ｌｏｃａｔｉｏｎｓａｎｄｔｈｅｓｉｚｅｏｆ

ｑｕｅｒｙｗｏｒｄｉｍａｇｅ．Ａｔｌａｓｔ，ｉｔａｐｐｌｉｅｄｔｈｅｔｗｏｄｉｒｅｃｔｉｏｎａｌｄｙｎａｍｉｃｔｉｍｅｗａｒｐｉｎｇ（ＤＴＷ）ｔｏｒｅｆｉｎｅｔｈｅｃａｎｄｉｄａｔｅｒｅｇｉｏｎｓ．Ｔｈｅ

ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｃａｎｄｅｔｅｃｔｔｈｅｑｕｅｒｙｗｏｒｄｉｎｔｈｅｄｏｃｕｍｅｎｔｉｍａｇｅｓｗｉｔｈｈｉｇｈｍｅａｎａｖｅｒａｇｅ

ｐｒｅｃｉｓｉｏｎａｎｄｔｈｅｔｗｏｄｉｒｅｃｔｉｏｎａｌＤＴＷｏｕｔｐｅｒｆｏｒｍｓｔｈｅｔｒａｄｉｔｉｏｎａｌＤＴＷ．

Ｋｅｙｗｏｒｄｓ：Ｃｈｉｎｅｓｅｈａｎｄｗｒｉｔｔｅｎｗｏｒｄｓｐｏｔｔｉｎｇ；ｓｅｇｍｅｎｔａｔｉｏｎｆｒｅｅ；ＳＩＦＴ；ｄｙｎａｍｉｃｔｉｍｅｗａｒｐｉｎｇ

０　引言

手写汉字检测旨在手写文档中寻找到需要查询的某个字，

即判定某一候选区域是否含有要检测的汉字。当今社会存在

着大量有价值的手写文档，许多都作为图像的形式进行保存，

然而对于手写文档的关键字查询仍是一个极具挑战性的问题。

由于中文文本不仅布局复杂、书写随意性大，使得传统的单字

ＯＣＲ识别变得不可行。而字符检测不用识别出每一个汉字，

可以利用图像检索中的技术来解决字符检测问题，因而字符检

测引起越来越多的学者关注。

Ｍａｎｍａｔｈａ等人

［１］

首先提出了字符检测的概念，将一个传

统ＯＣＲ识别问题转变为一个验证性的问题。这种理念弱化了

对文档检索前进行准确字符的分割，甚至不需要对文档进行任

何切割的预处理。基于文档被分割的层次，字符检测方法可以

分为基于字（字符）的、基于文本行的和无须分割的三个类别。

基于字分割字符检测技术意味着首先将文本图像切分为

独立的字符或字，然后将这些字和待查询的字进行匹配并判定

它们是否为相同的字符。

Ｒａｔｈ等人

［２］

研究了特征的表示方

法，他们发现使用上

／下轮廓信息、笔画像素／背景转换数目和

投影信息的组合作为特征结合ＤＴＷ可以获得最好的结果。

在文献［３］中，Ｚｈａｎｇ等人使用基于轮廓特征的两维ＤＴＷ方法

进行中文书法字符检索。

因为在同一行中两个字符间的空间很小，难以准确分割，

所以基于行分割字检测方法被提出。基于行的字检测方法首

先将文本图像分割为文本行，然后将待查询的字符与文本行进

行匹配判定文本行中是否含有该字符。基于文本行分割的字

符检测方法避免字符分割的困难，而文本行分割相对字符分割

要容易些。文献［４］提出一种隐马尔可夫模型（ＨＭＭ）的方法

进行字符检测；文献［

５］提出了基于多层反馈网络（ＲＮＮ）的字

符检测方法；Ｈｕａｎｇ等人在文献［６］中提出了一种使用汉字上

下文字符模型进行中文字符检测的方法，进而提高字符检测的

判别能力。

基于字符和基于文本行的字符检测方法都依赖于对文本

图像的预处理。预处理中的错误会很容易导致字符检测的失

败，因此字符检测的趋势是采用基于无分割的方法。近年来一

些基于无分割的字符检测方法被提出。基于无分割的字符检

第３３卷第１１期

２０１６年１１月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３３Ｎｏ１１

Ｎｏｖ．２０１６

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38731761

粉丝: 7
资源: 920

无分割手写汉字检测：两方向动态时间规整方法

基于mediapipe设计实现人体姿态识别python源码（基于动态时间规整算法（DTW）和LSTM（实现人体动作识别）.zip

无分割手写汉字检测：双向动态时间规整方法

基于动态时间扭曲的时间异常检测算法WETAS

行人重识别中的动态时间规整技术

时序模式匹配算法：动态时间规整与序列匹配

基于动态时间规整的孤立语音识别

基于动态时间规整的孤立字语言识别实验

动态时间规整算法matlab

动态时间规整（DTW）

提取特征参数mfcc; 使用动态时间规整(dtw)算法计算语音模板之间的距离 编程实现基

最新资源

提取特征参数mfcc; 使用动态时间规整(dtw)算法计算语音模板之间的距离编程实现基