# Audio num_mels = 80 # num_freq = 1024 n_fft = 2048 sample_rate = 16000 # preemphasis = 0.97 frame_shift = 0.0125 # seconds frame_length = 0.05 # seconds hop_length = int(sample_rate * frame_shift) # samples. win_length = int(sample_rate * frame_lengt
时间: 2023-06-13 12:07:49 浏览: 117
h) # samples. hop_length 和 win_length 用于计算短时傅里叶变换(STFT)的窗口大小和帧移,以便将音频信号转换为时频图。n_fft 是 STFT 的傅里叶变换点数,num_freq 是 STFT 的输出频率数量。preemphasis 是一种高通滤波器,有助于平衡低频和高频信号的能量。num_mels 是梅尔滤波器组的数量,用于将频率转换为梅尔刻度。该参数通常设置为80。sample_rate 是音频采样率,表示每秒钟采样的次数。frame_shift 和 frame_length 是以秒为单位的帧移和帧长。
相关问题
mfcc1 = librosa.feature.mfcc(y=y_remix, sr=fs, n_mfcc=n_mfcc, n_fft=n_fft, win_length=win_length, hop_length=hop_length, n_mels=n_mels)
这是计算音频信号的梅尔频率倒谱系数(MFCC)的代码,使用了Librosa库。其中y_remix是音频信号,sr是采样率,n_mfcc表示返回的MFCC数量,n_fft是FFT窗口大小,win_length是窗口长度,hop_length是窗口重叠,n_mels是梅尔带滤波器的数量。
def preprocess_X_Train(audio_path, sr=22050, n_fft=2048, hop_length=512, n_mels=128): # 设置文件夹路径 audio_path = r'G:\Master\Papers\Audio Source\train' # 获取文件夹中所有音频文件的路径 audio_files = [os.path.join(audio_path, f) for f in os.listdir(audio_path) if f.endswith('.wav')]
这是一个名为preprocess_X_Train的函数,它的作用是对音频文件进行预处理。其中,audio_path是音频文件的路径,sr是采样率,n_fft是FFT窗口大小,hop_length是帧移大小,n_mels是梅尔滤波器的数量。
阅读全文