WARNING (compute-mfcc-feats[5.5]:main():compute-mfcc-feats.cc:151) Failed to compute features for utterance 099_20230626230103_1909965030_wangxiaowei0-20 ERROR (compute-mfcc-feats[5.5]:ComputeFeatures():feat/feature-common-inl.h:47) Waveform and config sample Frequency mismatch: 8000 .vs 16000 (use --allow-upsample=true option to allow upsampling the waveform).
时间: 2024-04-15 22:26:00 浏览: 159
这个错误提示表明在计算音频特征时出现了问题。具体地说,它指出了音频的采样频率与配置文件中的采样频率不匹配。默认情况下,计算音频特征时要求音频的采样频率与配置文件中设置的采样频率一致。
解决这个问题的一种方法是使用 `--allow-upsample=true` 选项来允许对音频进行上采样,将其采样频率提高到配置文件要求的频率。这个选项可以在命令行中添加,具体的使用方法可能会根据你使用的工具或库而有所不同。
另外,你还可以尝试将音频的采样频率重新调整为配置文件要求的频率,以确保匹配。这可以通过使用音频处理工具(如Sox)来完成。
请注意,上述解决方案是基于错误信息并假设你正在处理音频特征提取的问题。如果你有其他上下文或更具体的问题,请提供更多信息以便我能够更好地帮助你。
相关问题
copy-feats --compress=true --write-num-frames=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2num_frames.1 ark:- ark,scp:/work/VPR/subtools_1229/exp/features/mfcc/data_mfcc_23_pitch_seg/raw_mfcc_pitch_seg.1.ark,/work/VPR/subtools_1229/exp/features/mfcc/data_mfcc_23_pitch_seg/raw_mfcc_pitch_seg.1.scp paste-feats --length-tolerance=2 'ark:compute-mfcc-feats --write-utt2dur=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2dur.1 --verbose=2 --config=subtools/conf/sre-mfcc-23.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- |' 'ark,s,cs:compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- | process-kaldi-pitch-feats ark:- ark:- |' ark:- compute-mfcc-feats --write-utt2dur=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2dur.1 --verbose=2 --config=subtools/conf/sre-mfcc-23.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- VLOG[2] (compute-mfcc-feats[5.5]:main():compute-mfcc-feats.cc:182) Processed features for key 001_20230623160347_0319007398_mentianyu-1 compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- ERROR (compute-kaldi-pitch-feats[5.5]:main():compute-kaldi-pitch-feats.cc:88) Sample frequency mismatch: you specified 16000 but data has 8000 (use --sample-frequency option). Utterance is 001_20230623160347_0319007398_mentianyu-1
这些命令是用于特征处理的一系列操作。首先,copy-feats命令将特征数据进行复制并保存到指定的ark和scp文件中。接下来,paste-feats命令将两个特征数据进行拼接。
其中,compute-mfcc-feats命令用于计算MFCC特征,并将结果存储在ark文件中。compute-kaldi-pitch-feats命令用于计算音高特征,并将结果存储在ark文件中。然而,在最后一条命令中,compute-kaldi-pitch-feats命令出现了错误。错误信息指示样本频率不匹配,你指定了16000Hz,但数据实际上是8000Hz。建议使用--sample-frequency选项来指定正确的样本频率。该错误发生在utterance为"001_20230623160347_0319007398_mentianyu-1"的情况下。
LOG (process-kaldi-pitch-feats[5.5]:main():process-kaldi-pitch-feats.cc:85) Post-processed pitch for 0 utterances. WARNING (paste-feats[5.5]:main():paste-feats.cc:137) Missing utt 001_20230623160347_0319007398_mentianyu-1 from input ark,s,cs:compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- | process-kaldi-pitch-feats ark:- ark:- |
这些日志信息是与Kaldi语音识别工具相关的内容。第一条日志记录了处理了0个句子的后处理音高信息。第二条日志是一个警告,指示在输入的ark文件中缺少了名称为"001_20230623160347_0319007398_mentianyu-1"的句子。此警告来自paste-feats工具,该工具用于将不同的特征数据进行拼接。
阅读全文