Fourier描述子在唇形分类中的应用

需积分: 5 0 下载量 170 浏览量 更新于2024-08-08 收藏 843KB PDF 举报
"基于Fourier描述子的唇形分类方法 (2015年) - 吉林大学学报(理学版) - 张泽梁, 宋绍成, 张滴石, 曹健" 本文主要探讨了唇读识别中的唇形状态描述问题,并提出了一种基于Fourier描述子的唇形分类方法。该方法首先通过迭代计算来确定嘴唇的位置和大小,这在计算机视觉中通常涉及图像处理和模式识别的技术。接着,利用边缘检测算法,例如Canny边缘检测或Sobel边缘检测,从图像中提取唇形的边界,这是图像分析的关键步骤,旨在突出图像中的显著轮廓。 然后,文章引入了Fourier描述子的概念。Fourier描述子是图像处理中的一个重要工具,它利用傅立叶变换将图像的形状信息转换到频域中,从而提取出图像的主要特征。对于唇形,这些特征值能够有效地表示其不同的状态,如开口、闭合、读音等。傅立叶变换将图像的边缘信息转化为一系列频率成分,其中高频成分对应于图像的细节,低频成分则代表基本形状。通过选取重要的Fourier系数,可以减小数据维度,同时保持关键特征,这对于后续的分类至关重要。 在特征提取之后,文章提到对转换得到的Fourier描述子进行正规化处理,以消除数据量纲差异和提高分类效果。正规化通常包括归一化或标准化等方法,使得数据集中在一定的范围内,有利于神经网络或其他机器学习模型的学习和优化。 最后,这些处理过的Fourier描述子被输入到人工神经元网络(ANN)中进行分类。ANN是一种模拟人脑神经元结构的计算模型,能够通过学习过程识别复杂的模式和关系。在唇形识别任务中,网络会根据训练数据学习到不同唇形状态之间的区分特征,从而实现高准确率的分类。 实验结果显示,该方法在唇形分类上的表现优秀,不仅分类正确率高,而且计算效率也较高。这表明该方法对于解决唇读识别中的状态确定问题具有实际应用价值。此外,关键词“唇部定位”、“唇型分类”和“Fourier描述子”揭示了研究的主要技术领域,包括计算机视觉中的对象定位和分类,以及信号处理中的特征提取技术。 这篇文章提出的基于Fourier描述子的唇形分类方法结合了图像处理、特征提取和机器学习,为唇读识别提供了一种有效而高效的解决方案。这一方法对于提高唇语识别系统的准确性和实时性具有重要意义,特别是在辅助听力障碍人士沟通或无声环境下的信息交流等方面具有广阔的应用前景。