语音中的MFCC和Fbank
时间: 2024-05-19 07:17:54 浏览: 84
语音的处理方法 分帧 加窗等操作,得到最后的MFCC特征
5星 · 资源好评率100%
的区别是什么?
MFCC(Mel-frequency cepstral coefficients)和Fbank(filter banks)都是音频信号处理中常用的特征提取方法。其中,MFCC在人类听觉模型中模拟了耳蜗的工作原理,将频率转换成Mel频率,再采用离散余弦变换(DCT)将信号投影到一个低维的空间中,得到一组提取出来的特征向量。而Fbank则是将音频信号通过一组不同宽度的三角滤波器进行滤波,再通过一些统计特征比如平均值、标准差等得到相应的特征向量。因此,两者的主要区别在于信号的转换方式和特征提取方式不同。
阅读全文