利用python对音频进行频谱分析
时间: 2023-07-11 18:14:01 浏览: 141
频谱分析是对音频进行信号处理的一种方法,它可以将音频信号转换为频谱图,从而可以更直观地了解音频的频率分布和能量分布情况。在Python中,可以使用一些库来进行音频频谱分析,其中比较常用的是librosa和pyaudio库。
下面是一个利用librosa库对音频进行频谱分析的示例代码:
```python
import librosa
import librosa.display
import matplotlib.pyplot as plt
# 读取音频文件
audio_file = "test.wav"
y, sr = librosa.load(audio_file)
# 计算短时傅里叶变换(STFT)
stft = librosa.stft(y)
# 计算功率谱密度(PSD)
psd = librosa.power_to_db(abs(stft)**2)
# 显示频谱图
librosa.display.specshow(psd, y_axis='linear', x_axis='time')
plt.title('Power Spectrogram')
plt.colorbar(format='%+2.0f dB')
plt.tight_layout()
plt.show()
```
在上述代码中,首先使用librosa库中的load函数读取音频文件,并计算其短时傅里叶变换(STFT),再根据STFT计算功率谱密度(PSD)并绘制频谱图。其中,y和sr分别为音频数据和采样率,stft为STFT结果,psd为PSD结果。可以根据需要对频谱图进行调整和美化,例如修改颜色、坐标轴刻度、标题等。
下面是一个利用pyaudio库进行实时音频频谱分析的示例代码:
```python
import pyaudio
import numpy as np
import matplotlib.pyplot as plt
# 设置参数
CHUNK = 1024 # 每个缓冲区的大小
FORMAT = pyaudio.paInt16 # 采样格式
CHANNELS = 1 # 声道数
RATE = 44100 # 采样率
# 初始化pyaudio对象
p = pyaudio.PyAudio()
# 打开音频流
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
# 绘制频谱图
fig, ax = plt.subplots()
x = np.arange(0, 2 * CHUNK, 2)
line, = ax.plot(x, np.random.rand(CHUNK), '-', lw=2)
ax.set_ylim(0, 255)
ax.set_xlim(0, CHUNK)
plt.xlabel('Frequency')
plt.ylabel('Amplitude')
# 实时更新频谱图
while True:
data = stream.read(CHUNK)
data = np.frombuffer(data, dtype=np.int16)
fft = np.fft.fft(data)
fft_abs = np.abs(fft)[:CHUNK]
line.set_ydata(fft_abs)
fig.canvas.draw()
fig.canvas.flush_events()
# 关闭音频流和pyaudio对象
stream.stop_stream()
stream.close()
p.terminate()
```
在上述代码中,首先设置了一些参数,例如缓冲区大小、采样格式、声道数、采样率等。然后初始化了一个pyaudio对象,并打开了一个音频流,用于实时读取音频数据。接着绘制了一个空的频谱图,其中x轴表示频率,y轴表示振幅。最后使用一个while循环,不断读取音频数据并进行FFT变换,得到音频的频谱信息,然后实时更新频谱图。可以根据需要对频谱图进行调整和美化,例如修改颜色、坐标轴刻度、标题等。最后在合适的时候关闭音频流和pyaudio对象。
阅读全文