印刷体越南字符识别：基于神经网络的OCR研究

版权申诉

24 浏览量更新于2024-08-07 收藏 7.81MB PDF 举报

"这篇硕士学位论文主要探讨了利用神经网络识别印刷体越南字符的技术，由东南大学的阮猛胜撰写，吴乐南教授指导，完成于2011年8月。" 在当前的信息时代，光学字符识别（OCR）技术扮演着重要的角色，它能将图像中的字符转换为可编辑的文本。尽管OCR对于人类来说是一项基本任务，但计算机实现这一功能却具有相当的挑战性，尤其是在识别手写字符时。这篇论文详细介绍了OCR的基本概念、发展历程、应用领域以及相关的技术手段。针对越南语这种具有独特字符集的语言，作者深入分析了越南字符的模式识别问题。越南语采用的是拉丁字母为基础的越南文字符集，包含有188个不同的印刷体字符。论文中，作者选择了前馈型反向传播（BP）神经网络作为识别模型，构建了一个500×240×188的三层神经网络分类器。这个网络设计旨在通过扫描图像自动识别孤立的越南字符，以实现自动化识别过程。在经过有监督的学习训练后，这个系统能够有效地识别图像中的越南字符，减少了漏检的情况，并且提高了字符分割的准确性。实验结果显示，这种方法在越南文字符识别上表现良好，具有较高的识别精度，为进一步的研究和优化提供了坚实的基础。关键词包括字符识别、神经网络、印刷体字符识别、光学字符识别以及BP算法。这些关键词揭示了论文的核心内容和技术手段，表明了该研究在神经网络应用领域的创新之处，特别是在处理非英文字符识别问题上的贡献。这篇论文为越南字符的自动识别提供了一种有效的方法，通过BP神经网络的训练和优化，提升了OCR技术在越南文环境下的应用效果。这不仅对于越南语的信息处理具有实际意义，也为其他类似语种的字符识别研究提供了参考和借鉴。