基于omp和gammatone的压缩感知语音增强与识别系统优化

需积分: 9 15 浏览量更新于2024-08-12 1 收藏 1.41MB PDF 举报

本文主要探讨了一种创新的基于压缩感知（CS）的语音增强识别系统，针对传统压缩感知方法在抗噪性能上的不足。在2016年的研究中，研究者茅正冲和龚熙针对这个问题提出了一个改进的解决方案。他们的系统在使用正交匹配追踪（OMP）算法进行语音信号重构时，引入了相关度阈值和语音恢复阈值的概念，这有助于精确地识别和恢复纯净语音信号，同时有效地提升了抗噪声的能力，降低了计算复杂度。传统的压缩感知方法依赖于信号的稀疏性来恢复信号，但可能在处理噪声信号时效果不佳。新系统通过调整这两个阈值，使得算法能够更加智能地筛选出与语音信号相关的部分，排除噪声干扰。此外，他们还对迭代算法进行了优化，提高了系统的稳定性和效率。重构后的语音信号被进一步通过Gammatone滤波器组进行特征参数GFCC（Gammatone Filterbank Constant Q cepstral coefficients）提取，这是一种常用的声音特征表示方法，能够捕捉到语音信号的频谱特性。这些特征参数随后被输入到高斯混合模型中进行匹配，用于声纹识别。高斯混合模型是一种强大的统计建模工具，能够很好地模拟实际的声纹分布，从而提高识别精度。实验结果显示，这种基于压缩感知的语音增强识别系统在实际应用，如声纹识别系统中表现出显著的优势，包括提升识别率和鲁棒性。这意味着它在嘈杂环境下的性能得到了明显改善，对于实际场景中的语音识别任务具有很高的实用价值。论文的研究背景是基于江苏省自然科学基金和国家自然科学基金的支持，两位作者分别在机器人视听觉识别和声纹识别领域有深入研究。他们的工作不仅解决了压缩感知在抗噪问题上的局限，也为相关领域的信号处理和语音识别技术提供了新的思路和方法。这篇论文的核心贡献在于提出了一种有效的语音增强策略，通过结合压缩感知、正交匹配追踪、抗噪算法和特征提取技术，显著提高了语音识别系统的性能，具有重要的工程应用价值。

书书书

收稿日期：２０１５０１２１；修回日期：２０１５０３１０　　基金项目：江苏省自然科学基金资助项目（ＢＫ２０１３１１０７）；国家自然科学基金资助项目

（６０９７３０９５）

作者简介：茅正冲（１９６４），男，江苏启东人，副教授，硕导，主要研究方向为机器人视听觉识别；龚熙（１９８９），男，江苏江阴人，硕士研究生，主

要研究方向为声纹识别及应用（８０６２７７３５１＠ｑｑ．ｃｏｍ）．

基于压缩感知的语音增强识别系统



茅正冲，龚　熙

（江南大学轻工过程先进控制教育部重点实验室，江苏无锡２１４１２２）

摘　要：针对传统压缩感知（ＣＳ）方法抗噪性能差的问题，提出了一种新的基于压缩感知的语音增强识别系统。

该系统在用正交匹配追踪（ＯＭＰ）算法重构语音信号时设定相关度阈值和语音恢复阈值，并对迭代算法进行改

进，不仅有效恢复了纯净语音信号，实现了语音增强，并且减少了重构的计算量；再将重构恢复的信号通过Ｇａｍ

ｍａｔｏｎｅ

滤波器组提取特征参数ＧＦＣＣ，并在高斯混合模型中匹配。仿真实验表明，将这种方法应用于声纹识别系

统，系统的识别率及鲁棒性都有明显提高。

关键词：压缩感知；正交匹配追踪；抗噪算法；识别系统

中图分类号：ＴＮ９１２３　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０１６）０２０４５００４

ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１００１３６９５．２０１６．０２．０３１

ＳｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍｂａｓｅｄｏｎＣＳ

ＭａｏＺｈｅｎｇｃｈｏｎｇ，ＧｏｎｇＸｉ

（ＫｅｙＬａｂｏｒａｔｏｒｙｏｆＡｄｖａｎｃｅｄＰｒｏｃｅｓｓＣｏｎｔｒｏｌｆｏｒＬｉｇｈｔＩｎｄｕｓｔｒｙｏｆＭｉｎｉｓｔｒｙｏｆＥｄｕｃａｔｉｏｎ，ＪｉａｎｇｎａｎＵｎｉｖｅｒｓｉｔｙ，ＷｕｘｉＪｉａｎｇｓｕ２１４１２２，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｉｎｖｉｅｗｏｆｔｈｅｐｏｏｒａｎｔｉｎｏｉｓｅｐｅｒｆｏｒｍａｎｃｅｏｆｔｒａｄｉｔｉｏｎａｌｃｏｍｐｒｅｓｓｉｖｅｓｅｎｓｉｎｇ，ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｎｏｖｅｌｓｐｅｅｃｈ

ｅｎｈａｎｃｅｍｅｎｔｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍｂａｓｅｄｏｎｃｏｍｐｒｅｓｓｉｖｅｓｅｎｓｉｎｇ．Ｔｈｅｐｒｏｐｏｓｅｄｓｙｓｔｅｍｓｅｔｓｉｍｉｌａｒｉｔｙｔｈｒｅｓｈｏｌｄａｎｄｓｐｅｅｃｈｓｉｇｎａｌ

ｒｅｃｏｖｅｒｙｔｈｒｅｓｈｏｌｄｉｎｏｒｔｈｏｇｏｎａｌｍａｔｃｈｉｎｇｐｅｒｓｕｉｔ

（ＯＭＰ）ａｌｇｏｒｉｔｈｍ，ａｎｄｉｍｐｒｏｖｅｄｔｈｅｉｔｅｒａｔｉｖｅａｌｇｏｒｉｔｈｍ，ｗｈｉｃｈｎｏｔｏｎｌｙｒｅ

ｓｔｏｒｅｄｔｈｅｅｎｈａｎｃｅｄｓｐｅｅｃｈｓｉｇｎａｌ，ｂｕｔａｌｓｏｒｅｄｕｃｅｄｔｈｅａｍｏｕｎｔｏｆｃａｌｃｕｌａｔｉｏｎ．ＴｈｅｎｉｔｅｘｔｒａｃｔｅｄｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓＧＦＣＣｏｆｔｈｅ

ｅｎｈａｎｃｅｄｓｐｅｅｃｈｓｉｇｎａｌｂｙＧａｍｍａｔｏｎｅｆｉｌｔｅｒｂａｎｋ，ａｎｄｍａｔｃｈｅｄｔｈｅｂｅｓｔｒｅｓｕｌｔｉｎＧａｕｓｓｉａｎｍｉｘｔｕｒｅｍｏｄｅｌ．Ｓｉｍｕｌａｔｉｏｎｅｘｐｅｒｉ

ｍｅｎｔｓｓｈｏｗｔｈａｔｔｈｉｓｍｅｔｈｏｄｏｂｖｉｏｕｓｌｙｉｍｐｒｏｖｅｓｔｈｅｒｅｃｏｇｎｉｔｉｏｎｒａｔｅａｎｄｒｏｂｕｓｔｎｅｓｓｉｎｓｐｅａｋｅｒｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍ．

Ｋｅｙｗｏｒｄｓ：ｃｏｍｐｒｅｓｓｉｖｅｓｅｎｓｉｎｇ（ＣＳ）；ｏｒｔｈｏｇｏｎａｌｍａｔｃｈｉｎｇｐｕｒｓｕｉｔ（ＯＭＰ）；ａｎｔｉｎｏｉｓｅａｌｇｏｒｉｔｈｍ；ｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍ

　引言

压缩感知（ＣＳ）作为近些年新兴的信号处理技术，是一种

在采样过程中利用较少数据就能有效提取信号信息，然后通过

重构算法从采样信息中恢复原信号的方法

［１］

。语音增强是指

对带噪语音信号进行处理，降低噪声的干扰，恢复出较纯净的

语音。所以，压缩感知与语音增强的本质是类似的。ＣＳ理论

由于其边采样边压缩的特性使其具有了巨大的吸引力和应用

前景，研究领域已经涉及到了雷达、无线传感、医学等领域。文

献［

２］将压缩感知理论运用到了随机调制雷达信号处理中，为

随机调制雷达的低旁瓣信号处理提供了全新思路。文献［３］

将合成聚焦与ＣＳ理论结合，解决了Ｂ超成像过程中数据量大

的问题。

信号的稀疏性是压缩感知的前提和基础，但是正如语音和

图像等信号它们本身并不是稀疏的，但可以通过某种变换在其

变换域中得到一个稀疏的信号以此来适用压缩感知。语音信

号通常可以转换到离散变换域（

ｄｉｓｃｒｅｔｅｃｏｓｉｎｅｔｒａｎｓｆｏｒｍ，

ＤＣＴ）、小波域等变换域来获得稀疏信号。文献［４］对语音信

号在ＤＣＴ域能显示出的近似稀疏性提出语音信号ＤＣＴ域压缩

感知。文献［５］利用语音信号自身构造了一种自相关观测矩

阵，在同等重构性能下压缩率比其他随机矩阵更低。文献［

６］

在压缩感知的重构阶段设定相似度阈值来进行语音增强，该算

法对非人声噪声有一定抗干扰作用。文献［７］提出了离散余

弦小波包变换的语音信号压缩感知，构造出了更加稀疏的变换

基，提高了重构的性能。

针对不同噪声环境下ＣＳ理论难以恢复有用语音信息的

问题，提出了一种基于压缩感知的语音增强识别系统。在通过

ＯＭＰ算法重构有用语音信息时，根据语音信号和干扰噪声在

ＤＣＴ域稀疏性的不同设置相关度阈值来限制迭代的次数，让

尽可能少的噪声分量恢复出来。而在现实生活中绝大多数情

况下会受到人声背景噪声的干扰，如办公室、茶餐厅、超市等，

当背景噪声掺杂周边人语音信号时，仅设置相关度阈值不能有

效恢复纯净语音信号，因为此时背景噪声同样具有不错的稀疏

性。所以本文提出设置第二个门限阈值，即语音恢复迭代阈

值，以此来抑制人声背景噪声的回复。在重构过程中，如果低

于此阈值，则迭代停止。由于原始

ＯＭＰ算法迭代计算量大，本

文对重构部分也作了一定改进，减少了计算量。这种双门限阈

值的正交匹配追踪算法能够应对多种噪声环境场合，有效实现

语音增强，提高了系统最后的识别率，扩大了压缩感知在语音

去噪领域的适用性。

第３３卷第２期

２０１６年２月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３３Ｎｏ２

Ｆｅｂ．２０１６

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38739900

粉丝: 4
资源: 928

基于omp和gammatone的压缩感知语音增强与识别系统优化

代码 基于压缩感知算法的数据压缩与复原代码

Vue2 全家桶 + Vant 搭建大型单页面商城项目 新蜂商城前床分离版本-前端Vue 项目源码.zip

【创新未发表】基于matlab沙猫群算法SCSO-PID控制器优化【含Matlab源码 9671期】.zip

基于MySQL+Spark+Echarts+SpringBoot的豆瓣电影数据可视化项目源码+文档说明

vue chrome 扩展模板.zip

白鹭群算法ESOA优化TCN-BiLSTM-Multihead-Attention光伏预测Matlab 9572期.zip

黑猩猩算法Chimp优化TCN-BiLSTM-Multihead-Attention光伏预测Matlab 9589期.zip

python课程设计Django的购物商城系统源码+数据库（96分以上项目）

Unity+Photon制作的崩坏3同人，第三人称多人联网竞技射击游戏

北方苍鹰算法NGO优化TCN-BiLSTM-Multihead-Attention光伏预测Matlab 9576期.zip

最新资源

代码基于压缩感知算法的数据压缩与复原代码

Vue2 全家桶 + Vant 搭建大型单页面商城项目新蜂商城前床分离版本-前端Vue 项目源码.zip