time-frequency mask
时间: 2023-09-12 19:07:16 浏览: 166
WT-160说明书
Time-frequency mask 是指在深度学习的歌唱语音分离任务中,用于分离不同演讲者的独立语音信号的一种掩膜。它是通过将编码的视听信号与输入的噪音频谱相乘,然后将结果转换回时域波形,从而获得每个演讲者独立清晰的语音信号。 此掩膜的生成过程可以通过训练和优化源依赖掩膜来实现,而不需要使用后处理步骤,如使用泛化维纳滤波器。 这种方法通过引入循环推断算法、稀疏变换步骤和学得的去噪滤波器来改善掩膜的生成过程,从而提高了信号失真比和信号干扰比。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [不戴眼镜听不清?Google用视觉信号分离语音 | 附论文](https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/79922922)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* [无需进行滤波后处理,利用循环推断算法实现歌唱语音分离](https://blog.csdn.net/Uwr44UOuQcNsUQb60zk2/article/details/78526450)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文