去噪 Transformer
时间: 2023-10-14 11:55:51 浏览: 49
去噪Transformer是一种用于语音增强的神经网络模型。其中,T-GSA(Two-Stage Transformer Based Neural Network for Speech Enhancement)是一种基于改进的Transformer的模型,它包含了局部Transformer和全局Transformer,用于提取局部和全局的上下文信息,以解决长期依赖问题\[1\]。T-GSA模型的实现机制是通过输入含噪时域语音的STFT,经过Encoder得到语音信号的时频掩码,这个掩码是通过缩放噪声预测的干净的语音序列,最后通过iSTFT获得增强后的时域信号\[3\]。这种模型的提出是为了实现时域端到端的语音增强\[2\]。
#### 引用[.reference_title]
- *1* *2* *3* [语音去噪深度学习模型论文总结(大多基于transformer)](https://blog.csdn.net/NUSMYDREAM/article/details/122406166)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]