画一个MFCC滤波器组
时间: 2024-05-13 13:20:06 浏览: 8
以下是一个MFCC滤波器组的示意图:
```
|--------| |--------|
| Filter |---| |---| Filter |
| 1 | | | | n |
|--------| | | |--------|
| |
| |
|--------| |--------|
| Filter |---| Filter |
| 2 | | n-1 |
|--------| |--------|
```
在MFCC中,使用一组三角形滤波器对信号进行处理,以提取与人类听觉相关的特征。滤波器组通常由20-40个三角形滤波器组成。每个三角形滤波器的中心频率都不同,而且它们的带宽也逐渐变宽。
在上面的示意图中,每个滤波器都是由一个低通滤波器和一个高通滤波器组成的。这些滤波器的输出会被取对数,以产生用于下一步分析的特征。
相关问题
用c语言提取44100hz的40个mfcc系数中当mel滤波器组为128个、加窗为1048时各个步骤的参数如何变化
在提取44100Hz的40个MFCC系数时,当Mel滤波器组为128个、加窗为1048时,各个步骤的参数如下:
1. 预加重:预加重滤波器的增益因子为0.97。
2. 分帧:将预加重后的语音信号分成长度为25ms或30ms的帧,且相邻两帧重叠10ms。
3. 加窗:对每一帧信号进行长度为1048的汉明窗加窗处理,以减少频域泄漏。
4. 快速傅里叶变换(FFT):对加窗后的每一帧信号进行FFT变换,将时域信号转换为频域信号,得到2048个频率点。
5. 功率谱估计:对FFT变换的结果进行模平方运算,得到每一帧信号的功率谱,有2048个功率谱系数。
6. Mel滤波器组:将功率谱通过128个Mel滤波器进行滤波,得到128个Mel频率倒谱系数(MFCC)。
7. 离散余弦变换(DCT):对MFCC系数进行DCT变换,得到最终的40个MFCC系数。
8. 能量归一化:对MFCC系数进行能量归一化处理,以消除不同说话者之间的能量差异。
需要注意的是,当Mel滤波器组的数量增加时,可以更好地保留语音信号的谐波结构和共振峰信息,但也会增加计算量和存储量。当加窗长度为1048时,可以兼顾时域和频域的分辨率,以获得更好的频谱信息。
Mel滤波器组具体公式中的每个字母含义
在Mel滤波器组的具体公式中,每个字母的含义如下:
- H_m(f): 表示第m个Mel滤波器在频率f处的响应值。
- f: 频率,表示输入信号的频率。
- f_m: 第m个Mel滤波器的中心频率。
- f_0: 参考频率,通常取为1000 Hz。
- m: 滤波器组的索引,表示第m个滤波器。
- M: 滤波器组的总数,表示滤波器的数量。
Mel滤波器组的公式可以表示为:H_m(f) = 0,当 f < f_m-1 或 f > f_m+1;
H_m(f) = (f - f_m-1) / (f_m - f_m-1),当 f_m-1 <= f <= f_m;
H_m(f) = (f_m+1 - f) / (f_m+1 - f_m),当 f_m <= f <= f_m+1。
其中,f_m-1、f_m和f_m+1分别表示第m个滤波器的左邻频率、中心频率和右邻频率。Mel滤波器组常用于语音信号处理中的特征提取,如计算MFCC特征。它可以将频谱信息映射到梅尔刻度上,使得更符合人耳对声音感知的特性。