def stft(self, wave): result = [] # 按列为主序存储,也就是按通道为主序 wave = np.asfortranarray(wave) window = hann(self.frame_length, sym=False) channels = wave.shape[-1] for c in range(channels): data = wave[..., c] spectrogram = stft(data, n_fft=self.frame_length, hop_length=self.frame_step, window=window, center=False) spectrogram = np.expand_dims(spectrogram.T, axis=-1) result.append(spectrogram) result = np.concatenate(result, axis=-1) return result
时间: 2024-04-21 12:23:27 浏览: 173
stft.rar_site:www.pudn.com_倒谱平滑_图像倒谱_声呐STFT_语音识别
这是一个名为 `stft` 的函数,它执行短时傅里叶变换(STFT)来将音频波形转换为频谱图。
该函数接受一个名为 `wave` 的输入参数,它是一个音频波形。该波形可以是多通道的,每个通道的数据存储在最后一个维度上。
以下是函数的实现步骤:
1. 将输入的音频波形转换为Fortran格式的数组,以确保按列为主序存储。
2. 定义一个汉宁窗口,用于在进行STFT时加窗。
3. 获取音频波形的通道数。
4. 对每个通道进行以下操作:
- 获取当前通道的数据。
- 使用给定的帧长度、帧移、窗口函数等参数进行STFT计算,得到频谱图。
- 将频谱图进行转置并添加一个额外的维度,以便与其他通道对应。
- 将结果添加到结果列表中。
5. 将所有通道的结果在最后一个维度上进行拼接。
6. 返回拼接后的结果。
请注意,这段代码中使用了一些函数和库,如 `np.asfortranarray`、`hann` 和 `stft`。如果你需要运行此代码,请确保导入相应的库和定义这些函数。
阅读全文