ASRT语音识别卷积神经网络图
时间: 2023-11-02 20:05:45 浏览: 63
ASRT语音识别系统的卷积神经网络图基于全卷积神经网络结构,并借鉴了VGG网络配置。该网络模型采用深度全卷积神经网络,将语谱图作为输入。它具有很强的表达能力,可以捕捉到长期的历史和未来信息,比传统的循环神经网络在鲁棒性方面更出色。在输出端,模型与CTC(Connectionist Temporal Classification)方案完美结合,实现了端到端的训练,将声音波形信号直接转录为中文普通话拼音序列。语言模型方面,采用了最大熵隐含马尔可夫模型,将拼音序列转换为中文文本。此外,为了提供服务于所有用户,该系统还使用Python的HTTP协议基础服务器包,提供基于网络HTTP协议的语音识别API,通过网络调用该API实现语音识别功能。