结合之前几段代码,解释adjusted_fft_frames = mag_frames * np.exp(1j * 2 * np.pi * pitch_freqs_smoothed[:, np.newaxis]* freqs[np.newaxis, :])
时间: 2024-01-17 14:08:05 浏览: 91
Asjusted-rand-index.zip_Adjusted Rank index_Asjusted rand index_
在这段代码中,首先使用了之前处理得到的pitch_freqs_smoothed数组,这个数组包含了每一帧的基频对应的频率,然后使用了numpy的广播机制,将其转化为一个二维数组,其中每一行都是pitch_freqs_smoothed数组。另外,使用了freqs数组,这个数组包含了每一个FFT bin的分辨率,即每个bin对应的频率值,它是一个一维数组。
接下来,对于每一帧,在每个FFT bin的位置上,乘以一个复数值,这个复数值的实部是1,虚部是2π乘以相应的频率值,这个频率值是pitch_freqs_smoothed数组中对应帧的值。这个复数可以看作是一个旋转因子,它的幅度为1,相位随着频率的变化而变化,这个过程可以看作是在对FFT frame做频率变换。最后,将经过变换的FFT frame乘以mag_frames,这个mag_frames是之前计算得到的原始FFT frame的幅度信息,这样可以得到经过调整的FFT frame,其中包含了音高的信息。
阅读全文