mossformer
时间: 2023-09-27 19:09:18 浏览: 55
MossFormer是一种语音分离模型,它有不同大小的模型,包括小模型MossFormer(S),中等模型MossFormer(M),和大模型MossFormer(L)。在WSJ0-2/3mix数据集上,MossFormer模型的结果优于之前所有模型的表现,除了具有10M参数的MossFormer(S)在WSJ0-2mix上表现稍差于具有29M参数的Wavesplit。使用数据增强后,MossFormer(L)在WSJ0-2mix/3mix上分别达到了22.8 dB和21.2 dB,并且达到了Cramer-Rao分离上限,在WSJ0-2mix/3mix上取得了最新的SOTA结果。
你可以在以下地址找到MossFormer模型的详细信息:https://modelscope.cn/models/damo/speech_mossformer_separation_temporal_8k/summary。
MossFormer模型与其他SOTA模型在公开数据集WSJ0-2mix/3mix和WHAM!/WHAMR!上进行了对比,具体对比结果可以参考下表。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [ICASSP 2023论文模型开源|语音分离Mossformer](https://blog.csdn.net/weixin_48827824/article/details/129443343)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]