用python画出Log-Mel 频谱图
时间: 2023-06-13 14:05:18 浏览: 448
spectral:python中的语音功能
要画出Log-Mel频谱图,需要进行以下步骤:
1. 读入音频文件,并将其转换为时间序列信号。
2. 将信号分帧,并进行加窗(通常使用汉明窗)。
3. 对每一帧进行快速傅里叶变换(FFT)。
4. 将FFT结果转换为功率谱,并将其映射到Mel频率尺度上。
5. 取对数并进行DCT变换,得到Log-Mel频谱系数(MFCC)。
6. 画出Log-Mel频谱图。
下面是一个简单的Python代码示例,用于绘制Log-Mel频谱图:
```python
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np
# 读入音频文件
y, sr = librosa.load('audio.wav')
# 分帧并进行加窗
n_fft = 2048
hop_length = 512
win_length = 2048
S = np.abs(librosa.stft(y, n_fft=n_fft, hop_length=hop_length, win_length=win_length, window='hamming'))
# 映射到Mel频率尺度
n_mels = 128
mel_f = librosa.filters.mel(sr=sr, n_fft=n_fft, n_mels=n_mels)
melspec = np.dot(mel_f, S)
# 取对数并进行DCT变换
logmelspec = librosa.power_to_db(melspec)
mfcc = librosa.feature.mfcc(S=logmelspec, n_mfcc=20)
# 绘制Log-Mel频谱图
librosa.display.specshow(mfcc, x_axis='time', cmap='cool')
plt.colorbar()
plt.title('Log-Mel Frequency Spectrogram')
plt.xlabel('Time (s)')
plt.ylabel('MFCC Coefficients')
plt.show()
```
这段代码读入名为“audio.wav”的音频文件,计算其Log-Mel频谱系数,并绘制出Log-Mel频谱图。你可以根据自己的需求修改参数,例如Mel频带数量、MFCC系数数量等。
阅读全文