环状生成对抗网络在深度语音去噪中的应用

53 浏览量更新于2024-08-30 收藏 1.57MB PDF 举报

"基于环状生成对抗网络的深度语音去噪方法通过创新的环状生成对抗网络设计，显著提升了语音去噪的性能，尤其在多种环境噪声中表现优秀。" 深度学习在语音信号处理领域已经取得了显著的进步，尤其是在语音去噪方面。然而，传统的深度学习去噪方法常常面临收敛速度慢和效果不佳的问题。为了克服这些挑战，文章提出了一个基于环状生成对抗网络（Cyclical Generative Adversarial Networks, C-GANs）的深度语音去噪新方法。C-GANs的独特之处在于其循环结构，这种结构允许网络在多个阶段之间迭代学习，从而提高模型的收敛性和去噪效果。生成对抗网络（GANs）是一种机器学习框架，由两个神经网络——生成器（Generator）和判别器（Discriminator）组成。生成器尝试从噪声数据中创建逼真的语音样本，而判别器则试图区分真实语音和生成器产生的假语音。在训练过程中，两者相互博弈，生成器逐渐提升生成语音的真实感，直到判别器无法区分真实和虚假，达到训练目标。在环状生成对抗网络中，这个对抗过程被扩展到多个周期，每个周期内生成器和判别器的角色会互换。这种设计增强了模型的学习能力，使得生成器可以从更复杂的噪声环境中学习到目标语音的特征，同时避免了模型过早收敛或陷入局部最优的情况。文章通过实验验证了这种方法的有效性，使用了包含40多种不同类型的噪声语音集进行测试。结果显示，在多项衡量标准下，该方法的去噪性能显著优于传统方法，提高了语音的清晰度和可读性。这对于需要高质量语音信号的应用，如移动通信、助听设备、语音识别和扬声器识别等，具有重要的实际意义。经典语音去噪方法，如参数法和非参数法，如谱减法、维纳滤波以及基于统计模型的方法，虽然在一定程度上能够抑制噪声，但它们往往依赖于特定的噪声假设或者需要大量的训练数据。相比之下，基于C-GANs的深度学习方法能够自适应各种噪声环境，无需严格的先验知识，因此在处理复杂和多变的噪声场景时更具优势。这项工作为深度语音去噪提供了一个新的视角，环状生成对抗网络的引入不仅提高了去噪效果，也拓宽了未来在语音处理领域的研究方向。随着技术的进一步发展，可以期待更高效、更智能的语音去噪算法出现，以满足不断提升的语音质量和可理解性的需求。

电子设计工程

Electronic Design Engineering

第 27卷

Vol.27

第 12期

No.12

2019年 6月

Jun. 2019

收稿日期：2018-11-11 稿件编号：201811041

作者简介：韩斌（1984—），男，安徽阜阳人，硕士，助理工程师。研究方向：电力系统自动化、信息化及音视频

图像处理。

语音信号是人类获取信息的非常重要的渠道，

也是人类信息沟通的的重要方式。自然环境中的

语音信号是由目标语音信号与多种环境噪声组成，

而在语音信号的采集和传输过程中，还引入电子设

备的内部电噪音。接收设备得到的语音信号不是

纯净的目标语音信号，而是受干扰的信号。干扰信

号可根据其性质分为宽带噪声和窄带噪声、加性噪

声和乘性噪声、相关噪声和不相关噪声。从带噪语

音信号中提取纯净的目标语音信号，就需要对该信

号进行噪声抑制。随着社会发展，人们对清晰语音

信号提出了越来越高的要求。语音去噪方法致力

于提高被加性噪声污染的语音的可读性和质量

[1]

。

应用涉及移动通信质量改善、助听器和人工耳蜗、

语音识别和扬声器识别系统中的预处理阶段

[2]

。语

音噪声抑制已成为语音处理中非常重要部分，设计

高效的语音噪声抑制算法是当前语音信号处理的

热点。

1 经典语音去噪方法及不足

经典的语音去噪方法包括参数法语音去噪和非

参数法语音去噪，如谱减法、维纳滤波、基于统计模

型的方法和子空间算法

[3-19]

。例如，一般语义噪声均

为 0 均值的平稳随机过程，且有大量数据支撑。因

此，通过上述假设对噪声进行拟合，并对每次拟合进

行检验，能够达到检验标准，确定最终的阶数。自适

应滤波语音降噪方法是通过双话筒形式，分别采集

噪音信号和带噪语音信号，然后从带噪语音信号的

幅度谱中减去经自适应滤波器之后的噪声分量，进

而实现语音信号的去噪。谱减法为语音信号降噪处

理领域经典的算法，基本思想为在频域对带噪语音

信号功率谱减去噪声功率谱，得到语音的幅度估

计。一般情况使用原始带噪语音信号的相位信息，

然后进行反傅里叶变换，即得到干净的语音信号估

计。统计方法能较充分地利用语音和噪声信号的统

计特性，一般需要建立模型库，需要训练过程中获得

基于环状生成对抗网络的深度语音去噪方法

韩斌，郝小龙，樊强，彭启伟，薛依铭

（南瑞集团有限公司江苏南京 211100）

摘要：针对基于深度学习的语音信号去噪方法存在难于收敛、性能不足的问题，本文提出了基于环

状生成对抗网络的深度语音信号去噪方法，设计了新型的环状生成对抗语义去噪网络。通过 40 余

种不同噪声语音集的试验，结果表明所提方法在 5 种衡量标准下都明显改善了去噪性能。

关键词：语音降噪；深度学习；环状生成对抗网络；信号处理

中图分类号：TN912.3 文献标识码：A 文章编号：1674-6236（2019）12-0163-05

Deep audio denoising by CycleGAN Network

HAN Bin，HAO Xiao⁃long，FAN Qiang，PENG Qi⁃wei，XUE Yi⁃ming

（NARI Group Corporation，Nanjing 211100，China）

Abstract: Traditional deep learning based audio denoising methods are difficult to convergence and their

performances are insufficient to practical applications. This paper proposes a new audio denoising

algorithms by CycleGAN，and design a new audio denoising network. By verifying the proposed method

on 40 different types of audio noises，the experimental results demonstrate that the proposed method

outperforms the existing methods obviously on five evaluation metrics.

Key words: audio denoising；deep learning；cycle generative adversarial networks；signal processing

--163

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38741317

粉丝: 3

环状生成对抗网络在深度语音去噪中的应用

生成对抗网络降噪算法

基于python深度学习的多模态模型用于预测环状肽的膜透性（图神经网络和序列到序列模型 结合提供准确膜透性预测）.zip

基于环状梯度折射率磁光玻璃的电流传感方法

反射内存网络（RFM网络）是基于环状/星状、高速复制的共享内存网络 它支持不同总线结构的多计算机系统，并且可以使用不同的操作系统

基于环状拓扑粒子群算法的工程结构优化.pdf

基于深度学习图神经网络+序列到序列模型的多模态模型，旨在用于预测环状肽的膜透性.zip

基于改进的循环神经网络深度学习跌倒检测算法.pdf

行业文档-设计装置-基于环状气浮平台的气浮轴承式机械臂重力补偿装置.zip

基于动态电流的锥束CT环状伪影校正方法

异步传输模式网络中模拟环状网络技术方法研究

最新资源

基于python深度学习的多模态模型用于预测环状肽的膜透性（图神经网络和序列到序列模型结合提供准确膜透性预测）.zip

反射内存网络（RFM网络）是基于环状/星状、高速复制的共享内存网络它支持不同总线结构的多计算机系统，并且可以使用不同的操作系统