脱机汉字识别技术与特征提取优化

需积分: 0 63 浏览量更新于2024-07-22 1 收藏 1021KB DOC 举报

"脱机汉字识别的研究" 脱机汉字识别是一项重要的信息技术，它涉及计算机视觉、模式识别和人工智能等多个领域。这项技术的主要目标是让计算机能够自动识别在图像中的离线手写汉字，从而实现自动化的文字处理。本文将深入探讨汉字识别的基本过程，包括图像预处理、特征提取和分类器设计。首先，汉字识别的基本过程通常包含以下几个步骤。导言部分可能概述了脱机汉字识别的重要性和应用前景，强调了这项技术在自动化办公、文档处理、信息安全等方面的关键作用。接着，文章提到的“新的特征优劣量度标准”是指用于评估不同特征提取方法有效性的指标。类间类内方差比是一种独立于分类器的衡量方法，它可以量化不同特征集的区分度，帮助优化特征选择，提高识别准确率。在噪声去除环节，文章可能讨论了如何处理图像中的不规则元素，以确保后续步骤的准确性。预处理包括归一化，它通常分为细化、提取轮廓等步骤。细化有助于去除细小的噪声，提取轮廓则有助于保留汉字的基本形状。弹性网格方法，如矩形和扇形弹性网格，用于进一步规范化汉字形状，便于特征提取。特征提取是识别的核心，文章详细列举了多种方法。方向分解，包括合取、析取、方向长度分解以及边缘检测分解，通过分析汉字的边缘特征来捕获其形状信息。边缘检测算子如Prewitt、Sobel和Kirsch各有特点，适用于不同的图像环境。边缘梯度方向角分解则进一步细化了边缘信息。此外，Gabor方向分解利用Gabor滤波器捕捉频率和方向信息，黑像素分布特征关注汉字内部的黑色像素分布，不变矩特征如Hu不变矩和仿射不变矩则提供了形状的几何不变性，使得汉字在不同视角或变形下仍能被正确识别。分类器设计是识别系统的另一关键环节。模板分类器基于预先定义的模板进行匹配，而神经网络，如BP网络和LVQ网络，通过学习和调整权重实现分类。隐马尔可夫过程分类器则利用状态转移概率模型来处理序列数据，适应汉字的连笔特性。通过对各种分类器的实验比较和改进，如优化BP神经网络的结构，作者提升了识别系统对超多类别（如大量汉字）的分类性能。最终，文章提出了一个可行的脱机汉字识别方案，这个方案综合了优化的预处理方法、高效的特征提取和优化的分类器，以提高整体的识别效率和准确性。脱机汉字识别是一项复杂的技术，涉及到图像处理、特征工程和机器学习等多个方面。本文通过深入研究和实验，为这个领域提供了有价值的理论和实践贡献。

图六：汉字轮廓提取结果

4.3. 弹性网格

弹性网格划分是为了消除汉字大小、位置、笔划粗细和局部扭转对识别的

影响在提取特征之前作的预处理。

4.3.1. 矩形弹性网格

矩形弹性网格划分结果每个网格都是矩形。它使用密度均衡原则，将汉字

分成 M N 的网格，水平方向上的 M 份每份的黑像素个数相等，垂直方向的 N

份也是每份的黑像素个数相等，这是全局矩形弹性网格；在此基础上，在每一

个网格中，再进行同样的密度均衡划分，这就是局部矩形弹性网格。这样的划

分可以不断地进行下去。每次划分作为一层，则全局矩形弹性网格是一层矩形

弹性网格，局部矩形弹性网格是多层矩形弹性网格。这样的划分，将能适应汉

字全局与局部的位移、缩放等变形，但网格不可以划分得太多，若太多则汉字

局部划分太细模糊程度减小，不利于对不同风格汉字的容忍；网格也不能分得

太少，若太少则汉字局部特征就会被抹杀掉了。[2]

矩形弹性网格是多层的，可使用树结构。每个节点存储一个网格的左上角

和右下角坐标以及子节点的指针。一个节点的所有子节点构成对这个节点所表

示的网格的划分，子节点个数是动态的。矩形弹性网格划分的算法采用递归，

如下：

输入参数：层数 layer,划分的行数 M，划分的列数 N,父节点指针

开始：

1）子节点数为 M N，申请 M N 个节点空间，将父节点的子节点指

针指向它们；

2）计算父节点中的网格内黑像素的个数 sum；

3）计算划分的 M 行每行的黑像素数 sum/M；

4）根据每行的黑像素数对父节点的网格进行 M 行划分，将划分后的坐

剩余62页未读，继续阅读

baidu_28630191

粉丝: 0
资源: 1

脱机汉字识别技术与特征提取优化

紫光身份证OCR离线识别

讯飞离线语音识别——语音转文字1

ocr脱机字符识别源代码 c++

改进分组细化与远端拐点法：脱机汉字识别笔段提取效率提升

脱机手写汉字识别研究 (2010年)

基于粗细粒度深度学习的脱机手写汉字识别.pdf

脱机手写汉字识别技术现状与趋势

脱机手写汉字识别的字符切分技术研究

脱机手写汉字识别技术深度解析与应用

深度学习驱动的脱机手写汉字识别系统

最新资源