语音 transformer
时间: 2023-10-05 07:04:14 浏览: 126
transformer的 encoder-decoder结构基于tensorflow实现的中文语音识别项目.zip
语音Transformer是一种使用Transformer模型进行语音识别的方法。它可以将语音信号转化为相应的文本输出。然而,由于Transformer模型在处理较长语音输入时存在存储和计算复杂度增加的问题,原生的Transformer难以应用于流式语音识别。为了解决这个问题,研究人员提出了一种名为Conv-Transformer Transducer的方法,它通过在Transformer层之间加入卷积层来降低帧率,同时获取未来信息。这种结构不仅能显著降低训练内存需求,还不会造成精度损失。因此,Conv-Transformer Transducer是一种有效的流式语音识别方法。
阅读全文