用python对一个wav文件进行logmmse算法降噪

首先，需要导入以下依赖库： ```python import numpy as np import scipy.signal as signal import scipy.io.wavfile as wavfile ``` 接着，我们可以定义一个logmmse函数： ```python def logmmse(sig, rate, noise_frames=6, SSub=1, alpha=0.98, over_sub=3, noise_mu=0.1): # 预处理 sig = sig.astype(np.float64) sig -= np.mean(sig) # 消除DC偏置 sig /= np.max(np.abs(sig)) # 归一化 # 分帧 N = 512 frames = signal.frame(sig, frame_length=N, hop_length=N//2).astype(np.float64) num_frames, frame_len = frames.shape # 分帧FFT frames_fft = np.fft.fft(frames, axis=1) # 计算帧能量 frame_energy = np.sum(frames ** 2, axis=1) / frame_len # 估计噪声能量 noise_frames_fft = frames_fft[:noise_frames] noise_energy = np.sum(noise_frames_fft ** 2, axis=1) / frame_len noise_mu = np.median(noise_energy) noise_energy_db = 10 * np.log10(noise_energy) # 初始化变量 alpha_s = 1 g = np.ones(frame_len) xi_w = np.ones(frame_len) xi_w_last = 0 sub_speech_flag = np.zeros(num_frames) over_sub_count = np.zeros(num_frames) # 主循环 for i in range(num_frames): # 计算当前帧信噪比 snr = 10 * np.log10(frame_energy[i] / noise_mu) snr_db = snr - 10 * np.log10(SSub) # 判断是否为语音帧 if snr_db > noise_energy_db.max(): sub_speech_flag[i] = 1 if sub_speech_flag[i]: # 计算当前帧的谱增益函数 gamma = np.minimum(np.maximum(alpha_s * (snr_db - noise_energy_db), 0), 1) # 调整谱增益函数 if xi_w_last > 1: over_sub_count[i] = over_sub_count[i-1] + 1 else: over_sub_count[i] = 0 if over_sub_count[i] < over_sub: xi_w = np.power(gamma, alpha) * xi_w_last else: xi_w = np.power(gamma, alpha) * (xi_w_last + 1) over_sub_count[i] = over_sub # 计算平滑系数 alpha_s = np.where(xi_w > xi_w_last, alpha_s + 0.1, alpha_s - 0.1) # 更新帧谱 g = np.minimum(xi_w, 1) else: # 更新噪声谱 noise_mu = (1 - noise_mu) * noise_mu + noise_mu * np.minimum(frame_energy[i] / noise_mu, 1) noise_energy = np.append(noise_energy[1:], frame_energy[i]) noise_energy_db = 10 * np.log10(noise_energy) xi_w_last = xi_w g = np.ones(frame_len) # 应用谱增益 frames_fft[i] *= g # 合成信号 stft = np.zeros((num_frames, N), dtype=np.complex64) stft[:, :N//2+1] = frames_fft stft[:, N//2+1:] = np.flip(np.conj(frames_fft[:, 1:N//2]), axis=1) sig_out = signal.istft(stft, hop_length=N//2)[1] # 去掉前面的静音部分 start = np.argmax(sub_speech_flag) sig_out = sig_out[start * N//2:] # 恢复幅度 sig_out *= np.max(np.abs(sig)) / np.max(np.abs(sig_out)) return sig_out ``` 最后，我们可以读取一个wav文件，调用logmmse函数进行降噪，然后保存降噪后的文件： ```python # 读取wav文件 rate, sig = wavfile.read('test.wav') # 降噪 sig_out = logmmse(sig, rate) # 保存降噪后的文件 wavfile.write('test_out.wav', rate, sig_out.astype(np.int16)) ``` 注意，logmmse函数中的参数可以根据实际情况进行调整，例如： - noise_frames：用于估计噪声能量的帧数 - SSub：语音信号的能量与噪声能量的比值 - alpha：平滑系数 - over_sub：连续多少帧使用xi_w_last+1进行谱增益调整 - noise_mu：初始噪声能量估计值

用python对一个wav文件进行logmmse算法降噪

相关推荐

python3 写一个WAV音频文件播放器的代码

Python对wav文件的重采样实例

python使用wxPython打开并播放wav文件的方法

用python对一个read.wav文件进行logmmse算法降噪

python怎样对音频进行降噪

音频降噪算法python 附代码

python人声降噪

用python的音频降噪

widrow-hoff lms算法进行语音降噪的代码

python音频降噪

python录音降噪

音频降噪python

语音降噪Python代码

只有输入语音，如何写widrow-hoff lms算法进行语音降噪的代码

python AudioSegment 音频降噪处理

语音识别降噪python代码

只有输入语音，如何基于小波降噪写widrow-hoff lms算法进行语音降噪的代码

只有输入语音，如何写变步长的widrow-hoff nlms算法进行语音降噪的代码

ssa算法代码对应不同的测试函数python

最新推荐

分行业城镇非私营单位就业人员平均实际工资指数(2004-2011年).xls

（更新至2022年）分行业城镇非私营单位就业人员年末人数.xls

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

输出删除n个数字，使得被删后的数字最小

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

编写一个函数，用以判断一个任意的年份是否为闰年，然后调用这个函数找出2000-3000之间的所有闰年。