% 定义一些常量fft_size = 2048;hop_size = fft_size/4;min_freq = 80;max_freq = 1000;% 读取音频文件filename = 'example.aac';[x, Fs] = audioread(filename);% 计算音高[f0, ~] = yin(x, Fs, fft_size, hop_size, min_freq, max_freq);f0 = medfilt1(f0, 5); % 中值滤波midi = freq2midi(f0);% 计算主音调[~, max_idx] = max(histcounts(midi, 1:128));dominant_note = max_idx - 1;% 输出结果fprintf('主音调:%.2f Hz\n', midi2freq(dominant_note));function [f0, rms_energy] = yin(x, fs, fft_size, hop_size, min_freq, max_freq)% YIN算法计算音频信号的基频% 初始化变量n_frames = floor((length(x)-fft_size)/hop_size) + 1;f0 = zeros(n_frames, 1);rms_energy = zeros(n_frames, 1);% 计算自相关函数x = x(:);x = [x; zeros(fft_size, 1)];acf = xcorr(x, fft_size, 'coeff');acf = acf(ceil(length(acf)/2):end);% 计算差值函数d = zeros(fft_size, n_frames);for i = 1:n_frames frame = x((i-1)*hop_size+1:(i-1)*hop_size+fft_size); for tau = 1:fft_size d(tau, i) = sum((frame(1:end-tau) - frame(1+tau:end)).^2); endend% 计算自相关函数的倒数acf_recip = acf(end:-1:1);acf_recip(1) = acf_recip(2);acf_recip = acf_recip.^(-1);% 计算累积平均能量running_sum = 0;for i = 1:n_frames running_sum = running_sum + sum(x((i-1)*hop_size+1:(i-1)*hop_size+fft_size).^2); rms_energy(i) = sqrt(running_sum/fft_size);end% 计算基频for i = 1:n_frames r = acf_recip./(acf(i:end).*acf_recip(1:end-i+1)); r(1:i) = 0; r(max_freq/fs*fft_size+1:end) = 0; [~, j] = min(r(min_freq/fs*fft_size+1:max_freq/fs*fft_size)); f0(i) = fs/j;endendfunction midi = freq2midi(freq)% 将频率转换为MIDI码midi = 12*log2(freq/440) + 69;endfunction freq = midi2freq(midi)% 将MIDI码转换为频率freq = 440*2^((midi-69)/12);end对于此运算,数组的大小不兼容。 出错 yin (第 26 行) r = acf_recip./(acf(i:end).*acf_recip(1:end-i+1)); 出错 untitled2 (第 8 行) [f0, ~] = yin(x, Fs, fft_size, hop_size, min_freq, max_freq);请修改以上错误
时间: 2024-02-15 22:02:40 浏览: 18
这个问题是一个MATLAB代码错误,请先检查你的输入音频文件是否存在,并且检查你在函数调用yin()时传递的参数是否正确。如果参数正确,那么请检查yin()函数的代码第26行,尝试修改为:
```
r = acf_recip./(acf(i:end).*acf_recip(1:end-i)');
```
这里增加了一个转置操作,以使得acf_recip(1:end-i+1)和acf(i:end)的大小相同。
相关问题
fft_values = np.fft.fft(signal) freq = np.fft.fftfreq(n, d=dt)
fft_values = np.fft.fft(signal) 是一个用于计算信号的快速傅里叶变换(FFT)的函数。它将输入信号转换为频域表示,返回一个包含复数值的数组,表示信号在不同频率上的分量。
freq = np.fft.fftfreq(n, d=dt) 是用于计算频率轴上的离散频率值的函数。它接受两个参数:n 表示信号的长度,d 表示采样间隔(即时间间隔)。它返回一个包含离散频率值的数组,用于表示 FFT 结果的频率轴。
# Audio num_mels = 80 # num_freq = 1024 n_fft = 2048 sample_rate = 16000 # preemphasis = 0.97 frame_shift = 0.0125 # seconds frame_length = 0.05 # seconds hop_length = int(sample_rate * frame_shift) # samples. win_length = int(sample_rate * frame_lengt
h) # samples. hop_length 和 win_length 用于计算短时傅里叶变换(STFT)的窗口大小和帧移,以便将音频信号转换为时频图。n_fft 是 STFT 的傅里叶变换点数,num_freq 是 STFT 的输出频率数量。preemphasis 是一种高通滤波器,有助于平衡低频和高频信号的能量。num_mels 是梅尔滤波器组的数量,用于将频率转换为梅尔刻度。该参数通常设置为80。sample_rate 是音频采样率,表示每秒钟采样的次数。frame_shift 和 frame_length 是以秒为单位的帧移和帧长。