MFCC特征提取的原理
时间: 2023-10-26 11:42:59 浏览: 141
MFCC特征提取
3星 · 编辑精心推荐
MFFC(Mel-frequency cepstral coefficients)特征提取是一种语音信号处理技术,其原理如下:
1. 首先将语音信号进行预处理,包括去除噪声、增加语音信号的动态范围、分帧等操作。
2. 对每一帧语音信号进行傅里叶变换,得到该帧信号的频谱表示。
3. 为了更好地模拟人耳对声音的感知,MFFC特征提取使用梅尔滤波器组对频谱进行滤波。梅尔滤波器组是一组等间隔的三角滤波器,其中心频率按照梅尔刻度等比例排列。梅尔刻度是一种非线性尺度,人耳对声音的感知也是非线性的,因此使用梅尔滤波器组可以更好地模拟人耳的感知。
4. 对每个梅尔滤波器输出的能量值取对数,得到梅尔频谱系数(Mel frequency spectrum coefficients)。
5. 对梅尔频谱系数进行离散余弦变换(DCT),得到MFFC系数。这些系数通常是通过PCA或其他降维技术来进一步压缩的。
6. 最终得到的MFFC系数可以用于语音识别、语音合成、说话人识别等应用。
阅读全文