多重几何特征与CNN驱动的脱机数学手写公式识别提升技术

需积分: 34 2 下载量 10 浏览量 更新于2024-08-13 1 收藏 1.84MB PDF 举报
本文主要探讨了"基于多重几何特征和卷积神经网络的脱机手写算式识别"这一课题,针对中小学数学课堂中常见的、具有复杂二维空间结构的手写算式识别问题,提出了一种创新的方法。研究者付鹏斌、彭荆旋、杨惠荣和李建君团队在北京工业大学信息学部开展工作,他们关注的是如何在不依赖于实时输入设备(如触摸屏)的情况下,高效地识别诸如小数、分数、指数和根式等数学表达式的手写形式。 首先,他们采用了卷积神经网络(CNN)作为基础分类算法,对经过图像预处理后的手写字符进行识别。CNN在此场景中的运用,得益于其在图像处理领域的强大能力,能够自动学习并提取字符的特征,从而提高识别精度。图像预处理是关键步骤,包括去噪、灰度化、二值化等,以确保输入数据的质量和一致性。 接着,研究人员引入多重几何特征来增强识别复杂结构的算式。这些特征包括宽高比、质心坐标、质心偏移角度、中心偏移量以及水平重叠区间比等,这些特征能够捕捉到字符的空间布局信息,有助于识别含有嵌套关系的算式。例如,通过计算字符间的相对位置和比例,可以推断出分数、根号等符号的正确放置。 识别过程中,针对复合算式的识别采用了分治策略。这种方法将大问题分解成小问题逐步解决,对于算式嵌套结构,先识别内部部分,再根据几何特征判断外部结构,提高了整体识别的准确性和效率。 最后,他们设计并实现了脱机手写算式识别系统,系统能够在满足一定光照条件的情况下,对不同分辨率和含有噪声的图像达到较高的识别率,达到了90.43%。这表明该方法在实际应用中有很大的潜力,尤其是在教育领域,如自动批改作业、智能辅导等方面,能有效减轻教师的工作负担。 本文的研究成果对于提高手写算式识别的准确性和鲁棒性具有重要意义,并为今后的教育技术发展提供了新的思路。通过结合几何特征和深度学习技术,我们可以期待在未来的教育环境中,智能化的数学作业批改系统将变得更加智能、高效。