提升手机OCR性能:半阈值字符分割与识别关键技术

需积分: 0 1 下载量 82 浏览量 更新于2024-07-28 收藏 4.15MB PDF 举报
本文主要探讨了光学字符识别(Optical Character Recognition, OCR)技术在手机平台上的应用,针对当前OCR技术的关键环节,如字符检测、分割和识别,进行了深入研究。作者潘振兴以计算机科学与技术专业背景,尤其在计算机应用技术方向上,针对手机OCR系统的性能提升提出了创新性的解决方案。 首先,文章针对手机平台图像处理能力的局限性,提出了一种通过优化拍摄策略,利用字符检测技术来指导拍摄,从而降低图像的拒识率,并提高识别系统的整体效率。这表明了对OCR应用场景下特定硬件条件下的适应性改进。 在字符分割阶段,作者创新性地引入了结合识别的半阈值粘连字符分割方法。这种方法不同于传统的二值化处理,而是通过半阈值处理,能够更好地处理字符之间的粘连情况,显著提高了字符分割的准确性。实验结果显示,与投影法相比,基于半阈值的分割方法能够达到95.32%的分割正确率,显示出其优越性。 特征提取是识别过程中的关键步骤,文中采用半阈值为基础,对字符前景点进行分级处理,进一步提升了特征的提取质量。这种方法具有一定的鲁棒性,能够在一定程度上抵抗噪声干扰,提高识别的稳定性。 在字符识别阶段,作者采用了基于遗传优化的BP神经网络(Back Propagation Neural Network)。与常规的BP神经网络相比,这种优化后的模型具有更快的收敛速度和更高的识别率。这表明了智能优化算法在提高OCR精度方面的积极作用。 最后,作者通过在Nokia N95手机上构建的原型识别系统进行实战验证,该系统实现了仅有6.25%的图片拒识率和高达97.35%的字符识别正确率,充分证明了提出的半阈值字符分割和识别方法在实际应用中的高效和准确。 这篇硕士论文不仅总结了OCR技术的研究现状,还提出了针对手机平台的创新性技术改进,包括优化拍摄策略、半阈值粘连字符分割、分级特征提取以及遗传优化的BP网络,为手机OCR系统的高性能实现提供了理论支持和实践案例。这些研究成果对于提升移动设备上的文本识别能力具有重要意义。