基于MSER-CNN的商品图片字符检测与识别技术解析

需积分: 5 0 下载量 83 浏览量 更新于2024-06-18 收藏 4.11MB PDF 举报
"A002-吴冰冰-基于MSER-CNN的商品信息图片字符检测与识别.pdf",这份文档是第四届“泰迪杯”全国大学生数据挖掘竞赛的一篇优秀作品,由国防科学技术大学的吴冰冰、邓志鹏和傅瑞罡共同完成,指导教师未明确。该作品探讨了在电子商务领域如何利用MSER(Maximally Stable Extremal Regions)和卷积神经网络(CNN)技术来检测和识别商品信息图片中的字符。 在当前互联网+时代,商品图片中的文本信息对于消费者的购买决策至关重要,但这些光学字符无法直接被计算机检索和处理。因此,自动提取和识别图片中的文本信息成为了电子商务企业面临的技术挑战。文章中,作者首先对原始图片和标注数据进行了预处理,确保标注信息的准确性。 接下来,作者详细阐述了文本信息检测的过程,分为离线和在线两个阶段。离线阶段,他们利用HOG(Histogram of Oriented Gradients)特征和SVM(Support Vector Machine)、LeNet以及Fast-RCNN等方法对字符和非字符区域进行分类。在线阶段,通过MSER算法在8个通道中检测字符,然后通过形状分析和投影等方法精炼候选区域,最终确定单个字符区域。 字符识别部分,作者采用了CNN网络。在识别前,字符图像被预处理为灰度图像,并统一调整为“字亮底暗”的形式,以减少样本空间复杂度并提升识别准确率。离线训练阶段,他们设计了一个定制的CNN模型,其在测试集上达到了93.07%的识别正确率。然而,由于训练样本分布不均,可能导致过拟合。为解决这一问题,作者尝试了四种不同的改进策略:CNN结合HOG特征、集成CNN、双网络模型以及迁移学习的CNN。尽管这些方法在一定程度上改善了网络性能,但在样本分布不变的情况下,提高识别率仍然具有挑战性。 这篇作品深入探讨了基于MSER和CNN的字符检测与识别技术,对于电商平台的商品信息自动化处理有重要的参考价值。它展示了如何利用机器学习和深度学习技术来应对大数据环境下的文本信息提取难题,对于电子商务领域的文本信息自动化处理有着实际的应用前景。