为什么会报错：n_fft=2048 is too small for input signal of length=2

这个错误是因为你提供的音频信号长度太短，而你设置的 n_fft 参数值太大。n_fft 是指傅里叶变换的窗口大小，它决定了频谱分析的精度。根据通常的规则，n_fft 的取值应该是音频信号长度的一小部分，而不是比信号长度还要大。所以，将 n_fft 设置为比音频信号长度小的合适值，通常可以解决这个问题。你可以尝试减小 n_fft 的取值，然后再次运行代码。

python运行这段代码： for i in range(N_chirp): win1_IF[:, i] = signed_IF_matrix[0:N_FFT, i].reshape(N_FFT,1) * np.hanning(N_FFT).reshape(N_FFT,1) 已知N_FFT=256，N_chirp=8，为什么报错：could not broadcast input array from shape (256,1) into shape (256,)

报错的原因是尝试将形状为 (256,1) 的数组广播到形状为 (256,) 的数组上时出错。这通常发生在涉及数组广播的操作中，其中数组的形状不兼容。在这种情况下，问题出现在 `win1_IF[:, i] = signed_IF_matrix[0:N_FFT, i].reshape(N_FFT,1)` 这一行代码上。根据您提供的代码，`win1_IF` 是一个形状为 (256, N_chirp) 的数组，而 `signed_IF_matrix[0:N_FFT, i].reshape(N_FFT,1)` 是一个形状为 (256, 1) 的数组。要解决这个问题，您可以将 `signed_IF_matrix[0:N_FFT, i].reshape(N_FFT,1)` 改为 `signed_IF_matrix[0:N_FFT, i].reshape(N_FFT)`，这样它将具有与 `win1_IF[:, i]` 相同的形状。修改后的代码如下所示： ```python for i in range(N_chirp): win1_IF[:, i] = signed_IF_matrix[0:N_FFT, i].reshape(N_FFT) * np.hanning(N_FFT).reshape(N_FFT,1) ``` 这样修改后，数组广播操作将能够成功执行，不会再报错。

下面给出一段代码：class AudioDataset(Dataset): def init(self, train_data): self.train_data = train_data self.n_frames = 128 def pad_zero(self, input, length): input_shape = input.shape if input_shape[0] >= length: return input[:length] if len(input_shape) == 1: return np.append(input, [0] * (length - input_shape[0]), axis=0) if len(input_shape) == 2: return np.append(input, [[0] * input_shape[1]] * (length - input_shape[0]), axis=0) def getitem(self, index): t_r = self.train_data[index] clean_file = t_r[0] noise_file = t_r[1] wav_noise_magnitude, wav_noise_phase = self.extract_fft(noise_file) start_index = len(wav_noise_phase) - self.n_frames + 1 if start_index < 1: start_index = 1 else: start_index = np.random.randint(start_index) sub_noise_magnitude = self.pad_zero(wav_noise_magnitude[start_index:start_index + self.n_frames], self.n_frames) wav_clean_magnitude, wav_clean_phase = self.extract_fft(clean_file) sub_clean_magnitude = self.pad_zero(wav_clean_magnitude[start_index:start_index + self.n_frames], self.n_frames) b_data = {'input_clean_magnitude': sub_clean_magnitude, 'input_noise_magnitude': sub_noise_magnitude} return b_data def extract_fft(self, wav_path): audio_samples = librosa.load(wav_path, sr=16000)[0] stft_result = librosa.stft(audio_samples, n_fft=n_fft, win_length=win_length, hop_length=hop_length, center=True) stft_magnitude = np.abs(stft_result).T stft_phase = np.angle(stft_result).T return stft_magnitude, stft_phase def len(self): return len(self.train_data)。请给出详细注释

这段代码定义了一个 AudioDataset 类，继承自 PyTorch 中的 Dataset 类。主要用于处理音频数据。 ```python class AudioDataset(Dataset): def __init__(self, train_data): self.train_data = train_data self.n_frames = 128 ``` - `__init__` 方法：初始化函数，用于创建 `AudioDataset` 类的实例。传入一个 `train_data` 参数，该参数是一个列表，每个元素是一个二元组，分别表示干净音频文件路径和噪声音频文件路径。 - `train_data` 属性：将传入的训练数据存储在类的属性中。 - `n_frames` 属性：表示每个训练样本的长度，即帧数。 ```python def pad_zero(self, input, length): input_shape = input.shape if input_shape[0] >= length: return input[:length] if len(input_shape) == 1: return np.append(input, [0] * (length - input_shape[0]), axis=0) if len(input_shape) == 2: return np.append(input, [[0] * input_shape[1]] * (length - input_shape[0]), axis=0) ``` - `pad_zero` 方法：对输入的数据进行零填充，使其长度等于指定的长度。 - `input` 参数：输入的数据。 - `length` 参数：填充后的长度。 - `input_shape` 变量：输入数据的形状。 - 如果输入数据的长度大于等于指定长度，则直接返回原始数据。 - 如果输入数据是一维数组，则在数组末尾添加若干个零，使其长度等于指定长度。 - 如果输入数据是二维数组，则在数组末尾添加若干行零，使其行数等于指定长度。 ```python def __getitem__(self, index): t_r = self.train_data[index] clean_file = t_r[0] noise_file = t_r[1] wav_noise_magnitude, wav_noise_phase = self.extract_fft(noise_file) start_index = len(wav_noise_phase) - self.n_frames + 1 if start_index < 1: start_index = 1 else: start_index = np.random.randint(start_index) sub_noise_magnitude = self.pad_zero(wav_noise_magnitude[start_index:start_index + self.n_frames], self.n_frames) wav_clean_magnitude, wav_clean_phase = self.extract_fft(clean_file) sub_clean_magnitude = self.pad_zero(wav_clean_magnitude[start_index:start_index + self.n_frames], self.n_frames) b_data = { 'input_clean_magnitude': sub_clean_magnitude, 'input_noise_magnitude': sub_noise_magnitude } return b_data ``` - `__getitem__` 方法：该方法用于获取指定索引的训练样本。 - `index` 参数：指定的索引。 - `t_r` 变量：获取指定索引的训练数据。 - `clean_file` 和 `noise_file` 变量：分别表示干净音频文件和噪声音频文件的路径。 - `wav_noise_magnitude` 和 `wav_noise_phase` 变量：使用 librosa 库加载噪声音频文件，并提取其短时傅里叶变换（STFT）结果的幅度和相位。 - `start_index` 变量：指定从哪个位置开始提取数据。 - 如果 `(len(wav_noise_phase) - self.n_frames + 1) < 1`，说明 STFT 结果的长度不足以提取 `self.n_frames` 个帧，此时将 `start_index` 设为 1。 - 否则，随机生成一个 `start_index`，使得从噪声 STFT 结果中提取的子序列长度为 `self.n_frames`。 - `sub_noise_magnitude` 变量：对从噪声 STFT 结果中提取的子序列进行零填充，使其长度等于 `self.n_frames`。 - `wav_clean_magnitude` 和 `wav_clean_phase` 变量：使用 librosa 库加载干净音频文件，并提取其 STFT 结果的幅度和相位。 - `sub_clean_magnitude` 变量：对从干净 STFT 结果中提取的子序列进行零填充，使其长度等于 `self.n_frames`。 - `b_data` 变量：将干净 STFT 结果和噪声 STFT 结果作为字典类型的训练数据返回。 ```python def extract_fft(self, wav_path): audio_samples = librosa.load(wav_path, sr=16000)[0] stft_result = librosa.stft(audio_samples, n_fft=n_fft, win_length=win_length, hop_length=hop_length, center=True) stft_magnitude = np.abs(stft_result).T stft_phase = np.angle(stft_result).T return stft_magnitude, stft_phase ``` - `extract_fft` 方法：该方法用于对指定的音频文件进行 STFT 变换，并返回其结果的幅度和相位。 - `wav_path` 参数：指定的音频文件路径。 - `audio_samples` 变量：使用 librosa 库加载音频文件，并获取其音频采样值。 - `stft_result` 变量：对音频采样值进行 STFT 变换，返回其结果。 - `stft_magnitude` 和 `stft_phase` 变量：分别表示 STFT 变换结果的幅度和相位。 - 返回 STFT 变换结果的幅度和相位。 ```python def __len__(self): return len(self.train_data) ``` - `__len__` 方法：该方法用于返回训练数据的长度，即样本数量。

为什么会报错：n_fft=2048 is too small for input signal of length=2

python运行这段代码： for i in range(N_chirp): win1_IF[:, i] = signed_IF_matrix[0:N_FFT, i].reshape(N_FFT,1) * np.hanning(N_FFT).reshape(N_FFT,1) 已知N_FFT=256，N_chirp=8，为什么报错：could not broadcast input array from shape (256,1) into shape (256,)

相关推荐

IFFt_FFt_fft_ifft_matlab_ifft_

fft2.zip_fft2_fft2 matlab_fft2函数_fft2源码_matlab fft2 代码

FFT.rar_128 fft_N点fft_fft_fft 64_辐角和

mfcc_data = librosa.feature.mfcc(y=num, sr=samplerate, S=None, n_mfcc=1,hop_length=512, n_fft=2048)如何减少这段代码中特征值的数量

mfcc_data = librosa.feature.mfcc(y=num, sr=samplerate, S=None, n_mfcc=1,hop_length=512, n_fft=2048)这段代码输出是什么

def stft( y, n_fft=2048, hop_length=None, win_length=None, window="hann", center=True, dtype=None, pad_mode="reflect", ):

mfcc_data = librosa.feature.mfcc(y=num, sr=samplerate, S=None, n_mfcc=1,hop_length=512, n_fft=2048) #

这段代码有什么问题def preprocess_X_Train(audio_path, sr=22050, n_fft=2048, hop_length=512, n_mels=128): audio_path = r'G:\Master\Papers\Audio Source\train' audio_files = [os.path.join(audio_path, f) for f in os.listdir(audio_path) if f.endswith('.wav')]

stft_result = librosa.stft(audio_samples, n_fft=n_fft, win_length=win_length, hop_length=hop_length, center=True)

为什么这句代码会报错： NFFT <<= 1 ;报错原因是与先前NFFT的定义不同

# Audio num_mels = 80 # num_freq = 1024 n_fft = 2048 sample_rate = 16000 # preemphasis = 0.97 frame_shift = 0.0125 # seconds frame_length = 0.05 # seconds hop_length = int(sample_rate * frame_shift) # samples. win_length = int(sample_rate * frame_lengt

mfcc1 = librosa.feature.mfcc(y=y_remix, sr=fs, n_mfcc=n_mfcc, n_fft=n_fft, win_length=win_length, hop_length=hop_length, n_mels=n_mels)

input_fft = fft.rfft(input, dim=1) 中间发生了什么？

aka.rar_FPGA FFT_aka_fft fpga_fpga fft 2048

最新推荐

pre_o_1csdn63m9a1bs0e1rr51niuu33e.a

matlab建立计算力学课程的笔记和文件.zip

FT-Prog-v3.12.38.643-FTD USB 工作模式设定及eprom读写

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

2．通过python绘制y=e-xsin(2πx)图像