基于LPCC-Cep特征的腭裂语音高鼻音自动识别研究

需积分: 0 2 下载量 5 浏览量 更新于2024-09-05 收藏 878KB PDF 举报
本文主要探讨了"论文研究-基于声道特性的腭裂语音高鼻音等级自动识别"这一主题。该研究关注于解决腭裂患者普遍存在的语音问题,即由于口鼻腔异常导致的高鼻音和鼻漏气现象,这严重影响了他们的语音清晰度和日常生活交流。高鼻音的程度与腭咽闭合不全的严重性相关,因此对高鼻音等级的自动识别在临床评估中具有重要意义,能够帮助医生准确评估患者的腭咽功能。 研究者采用了先进的技术手段,即利用高低阶线性预测倒谱系数(LPCC)和倒谱系数的组合(LPCC-Cep特征组)作为声学特征参数。LPCC是一种常用的声音分析工具,能够捕捉到声音的周期性和非线性特性,而倒谱系数则反映了声音的频率成分。通过将这两者结合起来,可以提取出更为丰富的喉部和声道特性信息,从而提高高鼻音识别的准确性。 接着,研究团队采用了稀疏表示分类器(SRC)作为识别模型。SRC是一种基于稀疏编码的机器学习方法,其原理是寻找一个小型的基向量集合,使得输入信号可以被这些基向量以接近最简形式进行重构。这种特性使得SRC在处理复杂数据,如语音信号,时具有良好的分类性能。 实验结果显示,基于LPCC-Cep特征组的自动识别算法在四类高鼻音等级(正常、轻度、中度和重度)的识别上取得了显著的效果,达到了83.38%的正确识别率。这意味着该算法在实际应用中具有很高的实用价值,能有效辅助临床医生进行高鼻音级别的判断,从而为腭裂语音治疗提供客观的量化依据。 这项研究为提高腭裂语音高鼻音自动识别的精度和效率提供了新的视角和方法,对于改善腭裂患者的语音质量,促进康复治疗以及减少心理压力具有积极意义。随着人工智能和信号处理技术的发展,这类基于声道特性的语音识别技术有望在未来得到更广泛的应用和发展。