window = hann(self.frame_length, sym=False)

在给定的代码中，`window = hann(self.frame_length, sym=False)` 是使用 `hann` 函数创建一个汉宁窗口。 `hann` 函数是一个常用的窗口函数之一，用于在进行短时傅里叶变换（STFT）时对音频信号进行加窗处理。它可以减少频谱泄漏等问题，提高频谱估计的准确性。在这里，`self.frame_length` 是帧长度，是一个用于计算STFT的参数。通过将 `self.frame_length` 传递给 `hann` 函数，我们可以得到一个长度为 `self.frame_length` 的汉宁窗口。另外，`sym=False` 是 `hann` 函数的一个可选参数，用于指定是否对窗口进行对称处理。在这里，设置为 `False` 表示不进行对称处理。通过执行 `window = hann(self.frame_length, sym=False)`，我们将创建一个汉宁窗口，并将其赋值给变量 `window` 以供后续使用。请注意，具体的实现可能会因为代码上下文而有所不同。如果你需要更详细的帮助，请提供更多代码或上下文信息。

def stft(self, wave): result = [] # 按列为主序存储，也就是按通道为主序 wave = np.asfortranarray(wave) window = hann(self.frame_length, sym=False) channels = wave.shape[-1] for c in range(channels): data = wave[..., c] spectrogram = stft(data, n_fft=self.frame_length, hop_length=self.frame_step, window=window, center=False) spectrogram = np.expand_dims(spectrogram.T, axis=-1) result.append(spectrogram) result = np.concatenate(result, axis=-1) return result

这段代码定义了一个 `stft` 方法，用于计算音频信号的短时傅里叶变换（STFT）。下面是对该方法的解释： - `result` 是一个空列表，用于存储每个通道的STFT结果。 - `wave` 是输入的音频波形数据。 - `wave = np.asfortranarray(wave)` 将 `wave` 转换为 Fortran 数组，以确保按列为主序存储，也就是按通道为主序。 - `window = hann(self.frame_length, sym=False)` 创建了一个长度为 `self.frame_length` 的汉宁窗口。 - `channels` 获取 `wave` 数组的最后一个维度，即通道数。 - 在一个循环中，对每个通道进行以下操作： - `data = wave[..., c]` 提取当前通道的数据。 - `spectrogram = stft(data, n_fft=self.frame_length, hop_length=self.frame_step, window=window, center=False)` 对当前通道的数据应用 STFT，得到频谱图。 - `spectrogram = np.expand_dims(spectrogram.T, axis=-1)` 将频谱图转置，并在最后一个维度上添加一个新的维度。 - 将 `spectrogram` 添加到 `result` 列表中。 - `result = np.concatenate(result, axis=-1)` 将 `result` 列表中的所有频谱图沿最后一个维度进行连接，得到最终的结果。 - 返回最终的结果。请注意，上述代码中的 `stft` 函数和 `hann` 函数的具体实现可能来自外部库或其他地方，因此需要确保这些函数在代码的上下文中可用。

import torch class Network(torch.nn.Module): def init(self, n_fft=1024, n_hop=160, n_hidden=1024): super().init() self.linear1 = torch.nn.LSTM(n_fft//2+1, n_hidden//2, num_layers=2, batch_first=True, bidirectional=True) self.linear2 = torch.nn.Linear(n_hidden, n_fft//2+1) self.n_fft = n_fft self.n_hop = n_hop # self.window = self.register_buffer('window', torch.hann_window(n_fft)) def forward(self, noisy): # 傅里叶变换 noisy_spec = torch.stft(noisy, self.n_fft, self.n_hop, window=self.window, return_complex=True) # [B,C,T] noisy_amplitude = torch.abs(noisy_spec).transpose(2,1) # [B,T,C=513] # 神经网络计算 hidden = self.linear1(noisy_amplitude)[0] # [B,T,n_hidden=1024] mask = self.linear2(hidden).sigmoid() # [B,T,C=513] (0,1) # 降噪结果 denoise_spec = noisy_spec * mask.transpose(2,1) denoise_wav = torch.istft(denoise_spec, self.n_fft, self.n_hop, window=self.window) # 返回降噪后波形和降噪后谱图 return denoise_wav, denoise_spec if name == "main": net = Network() clean = torch.randn(4, 16000) noise = torch.randn(4, 16000) denoise_wav, denoise_spec = net(clean + noise) print(denoise_spec.shape, denoise_wav.shape)

这段代码实现了一个基于LSTM的音频降噪网络，其核心思路是使用LSTM对音频信号的幅度谱进行处理，从而得到一个掩膜（mask），该掩膜可以在频域上降噪信号。具体来说，该网络的输入是含有噪声的干净音频信号，经过傅里叶变换得到幅度谱，之后通过LSTM计算得到一个掩膜，最后将该掩膜应用于幅度谱上，得到降噪后的幅度谱，再通过逆傅里叶变换得到降噪后的音频信号。具体来说，该网络包括以下几个部分： - `__init__`函数：定义了一个两层的LSTM网络和一个线性层（用于将LSTM输出的隐藏状态转换为掩膜），并初始化了窗函数等参数。 - `forward`函数：实现了整个网络的前向传播过程。首先对输入信号进行傅里叶变换，得到幅度谱，之后将幅度谱通过LSTM处理得到一个掩膜，再将该掩膜应用于幅度谱上，得到降噪后的幅度谱，最后通过逆傅里叶变换得到降噪后的音频信号。 - `if __name__ == "__main__"`：对网络的功能进行测试，输入为一个随机产生的4秒钟的干净音频信号和一个随机产生的4秒钟的噪声信号，输出为降噪后的幅度谱和音频信号。需要注意的是，由于该网络使用了LSTM，其计算成本较高，需要在计算资源允许的情况下使用。此外，该网络的性能也取决于数据集的质量和训练过程的参数设置等因素。

阅读全文

window = hann(self.frame_length, sym=False)

相关推荐

MATLAB-window.rar_matlab wind_matlab window_window_窗函数_调用函数

HANN.rar_matlab 概率_matlab语音识别_神经网络 语音_语音识别 matlab

source_code_wesczs.zip_Window算法

hann_window = hann(N)'; signal_hann = signal .* hann_window;这段matlab代码是什么意思

def stft( y, n_fft=2048, hop_length=None, win_length=None, window="hann", center=True, dtype=None, pad_mode="reflect", ):

librosa.cqt(y=None, sr=22050, hop_length=512, fmin=None, n_bins=84, bins_per_octave=12, tuning=0.0, filter_scale=1, norm=1, sparsity=0.01, window='hann', scale=True, pad_mode='reflect', res_type=None)

1．根据下列技术指标，设计一个FIR数字低通滤波器： ω_p=0.2π,ω_s=0.4π,A_p=0.25dB,A_s=50dB 选择一个恰当的窗函数，确定单位冲激响应，绘出所设计的滤波器的幅度响应。

matlab的win_1d = window(@hann,79)语句转换为python代码

window = hann(100); noverlap = 45; nfft = 1024; [S,F,T] = spectrogram(sn,window,noverlap,nfft,fs);其中的各个参数代表什么意思

matlab-fir.rar_fir 窗函数_window function_海明窗fir_窗函数_窗函数 fir

大家在看

上海松江9000系列设备说明及调试

js 在线编辑office source 浏览器在线打开office

GNSS-R反演土壤水分研究分析

ansys_ls-dyna基础理论与工程实践配书K文件.rar_K文件_LS-DYNA 文件_ansys ls-dyna_dy

arcgis标准分幅图制作与生产

最新推荐

博途1200恒压供水程序，恒压供水，一拖三，PID控制，3台循环泵，软启动工作，带超压，缺水保护，西门子1200+KTP1000触摸屏

基于PLC的立体车库，升降横移立体车库设计，立体车库仿真，三层三列立体车库，基于s7-1200的升降横移式立体停车库的设计，基于西门子博图S7-1200plc与触摸屏HMI的3x3智能立体车库仿真控制

海康无插件摄像头WEB开发包(20200616-20201102163221)

PCNM空间分析新手必读：R语言实现从入门到精通

生成一个自动打怪的脚本

CarMarker-Animation: 地图标记动画及转向库

5G核心网元性能瓶颈揭秘

stm32连接红外传感器并将gsm900a短信收发实现报警

C语言时代码的实现与解析

5G SA核心网元性能问题分析

HANN.rar_matlab 概率_matlab语音识别_神经网络语音_语音识别 matlab