基于听觉模型的腭裂语音高鼻音自动识别系统研究

需积分: 0 3 浏览量更新于2024-08-05 收藏 747KB PDF 举报

本文主要探讨了结合听觉模型的腭裂语音高鼻音等级自动识别技术，这对于改善唇腭裂患者的生活质量和早期诊断具有重要意义。腭裂是一种常见的先天缺陷，伴随着一系列生理和言语问题，其中高鼻音是常见的语音特征。研究者针对这一问题，开发了一种自动分类系统。该系统的核心在于利用听觉模型来解析语音信号的内在表达，通过提取Soft Limited Ratio (SLR)谱特征，这是一种基于同步检测器的方法，可以捕捉到语音信号中的关键模式。同时，文章对比了不同的滤波器类型，如Gammatone滤波器（基于等效矩形带宽，ERB）和小波包滤波器（基于Bark尺度），发现Gammatone滤波器在识别效果上更优，因为它能更好地模拟人耳的频率响应特性。此外，研究还考察了滤波器通道数量对算法性能的影响，发现54个通道的设置在保证算法效率的同时，能够提供较高的识别准确率。在特征提取方面，实验结果显示同步检测器提取的SLR谱特征相较于侧抑制网络（Lateral Inhibition Network，LIN）提取的LIN谱特征更能有效地反映高鼻音的差异。实验数据来源于56名儿童的3086个语音样本，结果显示，最终的自动识别系统能够实现对腭裂语音高鼻音的四类等级（正常、轻度、中度和重度）的准确划分，最高分类正确率达到了惊人的91.50%，这为临床医生在非侵入性的方式下评估患者的腭咽功能提供了有力工具。结合听觉模型的腭裂语音高鼻音等级自动识别技术是一项创新性的研究，它利用先进的信号处理方法和技术，不仅提高了诊断的精确度，也为早期干预和个性化治疗提供了科学依据。未来，这项技术有望进一步推广和优化，以更好地服务于广大唇腭裂患者。

计算机工程与应用

www.ceaj.org

2019，55（10）

结合听觉模型的腭裂语音高鼻音等级自动识别

付方玲

，何飞

，付佳

，尹恒

，黄华

，何凌

1.四川大学电气信息学院，成都 610065

2.四川大学华西口腔医院，成都 610041

摘要：腭裂语音高鼻音等级的自动识别能为临床腭咽功能评估提供有效、客观、无创的辅助依据。对腭裂语音高

鼻音等级自动分类系统进行了研究，利用听觉模型提取语音信号的听觉内部表达，并结合同步检测器提取软限制比

（Soft Limited Ra tio，SLR）谱特征作为特征参数，利用一对一支持向量机（1-v-1 Support Vector Machine，1-v-1

SV M）实现腭裂语音高鼻音四类等级（正常、轻度、中度和重度）的自动划分。实验采用 56 名儿童的共 3 086 个语音

样本，并对比了使用不同基底膜滤波器种类和个数，使用同步检测器和侧抑制网络对识别效果的影响。实验结果表

明，使用基于等效矩阵带宽（Equ ivalent Rectangular Bandwidth，ERB）尺度的 Gammatone滤波器的识别效果优于基

于 Bark尺度的小波包滤波器；54个通道的滤波器能有效权衡算法时间成本和识别正确率；使用同步检测器提取 SLR

谱特征的识别效果优于侧抑制网络提取的 LIN（Latera l Inhibition Network）谱特征。腭裂语音高鼻音四类等级自动

识别系统最高分类正确率达 9 1.50%。

关键词：腭裂语音；高鼻音；听觉模型；同步检测器

文献标志码：A 中图分类号：TP391 doi：10.3778/j.is sn.1002-8331.1803-0060

付方玲，何飞，付佳，等 .结合听觉模型的腭裂语音高鼻音等级自动识别 .计算机工程与应用，2019，55（10）：127-134.

FU Fangling, HE Fei, FU Jia, et al. Automatic detection of hyp ernasali ty degrees in cleft palate speech based on human

auditory model. Computer Engineering and Applicatio ns, 2 019, 55（10）：127-134.

Automatic Detection of Hypernasality Degrees in C left Palate Speech Based on Human Auditory

Model

FU Fangling

, HE Fei

, FU Jia

, YIN Heng

, HUANG Hua

, HE Ling

1.College of Elect rical Engineering and Informat ion Technology, Sichuan University, C hengdu 610 065, China

2.West China H ospital of Stomatology, Sichuan University, Chengdu 610041, China

Ab stract：The automatic dete ctio n of hypernasality degrees in cleft palate spee ch can provide effective, objective and

non-invasive basis for the assessment of velopharyngeal function in clinical. In this work, an automatic dete ction system

of hypernasality degrees in cleft palate has been rese arched. The human auditory model is applied to extract the i nne r pre -

sentation of speech signal as the front-end processing, and the SLR（Soft-Limited Rati o）spectral features extracted from

the synchronous detector is used as the acoustic characteristic parameters. The 1-v-1 SVM（1-v-1 Support Vector Machine）

is utilized to automatically detect the hypernasality degrees（normal, mild, moderate and severe hypernasality）. Experi -

m ental data inclu de total 3 086 speeches from 56 kids, the comparisons of f ilter bank’s kind and num ber, sync hronous

detector and lateral inhibitory network are discus sed. And the results show that the Gammatone filter based on ERB

⦾模式识别与人工智能⦾

基金项目：国家自然科学基金青年科学基金项目（No. 61503264）。

作者简介：付方玲（1996—），女，硕士研究生，研究领域为语音信号处理，E-mail：183841 27060@163.com；何飞（1998—），女，硕士

研究生，研究领域为语音信号处理；付佳（1998—），女，硕士研究生，研究领域为语音信号处理；尹恒（1971—），女，副主

任护师，研究领域为腭裂语音评估；黄华（1961—），男，博士后，教授，博士生导师，研究领域为医学电子学；何凌

（1981—），通讯作者，女，博士，副教授，研究领域为语音信号处理。

收稿日期：2018-0 3-05 修回日期：2018-0 4-20 文章编号：1002-8 331（2019）10-0127-08

CN KI网络出版：2018-08-30, http://kns.cnki.net/kcms/detail /11.2127.TP.20180829.0834.002.html

Computer Engineering and Applications计算机工程与应用

127

下载后可阅读完整内容，剩余7页未读，立即下载

型爷

粉丝: 24

基于听觉模型的腭裂语音高鼻音自动识别系统研究

论文研究-基于声学特征的腭裂语音声韵母切分.pdf

腭裂术后语音训练学习教案.ppt

先天性生理性腭裂模型——鸡胚腭发育的初步观察

腭裂术后语音障碍患者实施连续护理干预的效果研究

两种术式修复大年龄腭裂的效果研究

维甲酸诱导腭裂小鼠出生前后Wnt通路相关信号分子的表达

1010例唇腭裂患者的临床资料分析

vue.js v2.5.17

DM8-SQL语言详解及其数据管理和查询操作指南

1108_ba_open_report.pdf

最新资源