python语音信号的预处理
时间: 2023-11-09 14:01:13 浏览: 163
语音信号预加重预处理
对于语音信号的预处理,一般包括以下几个步骤:
1. 读取音频文件,获取音频信号。
2. 对音频信号进行预加重,以强调高频部分。
3. 将音频信号分帧,通常每帧长度为20-40ms,帧与帧之间有重叠。
4. 对每一帧进行加窗,以减少频谱泄漏。
5. 对每一帧进行傅里叶变换,得到该帧的频谱。
6. 对频谱进行梅尔滤波,将线性频率刻度转换为梅尔刻度,并将高频部分分辨率降低。
7. 对梅尔滤波器组的输出进行离散余弦变换(DCT),得到每一帧的MFCC特征向量。
阅读全文