subtools/makeFeatures.sh --pitch true --pitch-config subtools/conf/pitch.conf data/mfcc_23_pitch/seg mfcc subtools/conf/sre-mfcc-23.conf
时间: 2023-07-17 11:08:56 浏览: 147
这个命令看起来是在使用 subtools/makeFeatures.sh 脚本生成音频特征。根据命令的参数,它将包括基频(pitch)信息,并使用 subtools/conf/pitch.conf 配置文件来设置基频计算的相关参数。生成的特征将保存在 data/mfcc_23_pitch/seg 目录下,并且特征类型为 mfcc,使用 subtools/conf/sre-mfcc-23.conf 配置文件来设置 MFCC 特征提取的相关参数。
这个命令的目的似乎是在进行语音处理或语音识别任务时,生成包含基频和 MFCC 特征的音频特征文件。具体的操作和工具可能会根据你使用的 subtools 脚本或库而有所不同。如果你还有其他问题或需要更多帮助,请提供更多上下文和详细信息。
相关问题
copy-feats --compress=true --write-num-frames=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2num_frames.1 ark:- ark,scp:/work/VPR/subtools_1229/exp/features/mfcc/data_mfcc_23_pitch_seg/raw_mfcc_pitch_seg.1.ark,/work/VPR/subtools_1229/exp/features/mfcc/data_mfcc_23_pitch_seg/raw_mfcc_pitch_seg.1.scp paste-feats --length-tolerance=2 'ark:compute-mfcc-feats --write-utt2dur=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2dur.1 --verbose=2 --config=subtools/conf/sre-mfcc-23.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- |' 'ark,s,cs:compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- | process-kaldi-pitch-feats ark:- ark:- |' ark:- compute-mfcc-feats --write-utt2dur=ark,t:exp/features/mfcc/data_mfcc_23_pitch_seg/log/utt2dur.1 --verbose=2 --config=subtools/conf/sre-mfcc-23.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- VLOG[2] (compute-mfcc-feats[5.5]:main():compute-mfcc-feats.cc:182) Processed features for key 001_20230623160347_0319007398_mentianyu-1 compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- ERROR (compute-kaldi-pitch-feats[5.5]:main():compute-kaldi-pitch-feats.cc:88) Sample frequency mismatch: you specified 16000 but data has 8000 (use --sample-frequency option). Utterance is 001_20230623160347_0319007398_mentianyu-1
这些命令是用于特征处理的一系列操作。首先,copy-feats命令将特征数据进行复制并保存到指定的ark和scp文件中。接下来,paste-feats命令将两个特征数据进行拼接。
其中,compute-mfcc-feats命令用于计算MFCC特征,并将结果存储在ark文件中。compute-kaldi-pitch-feats命令用于计算音高特征,并将结果存储在ark文件中。然而,在最后一条命令中,compute-kaldi-pitch-feats命令出现了错误。错误信息指示样本频率不匹配,你指定了16000Hz,但数据实际上是8000Hz。建议使用--sample-frequency选项来指定正确的样本频率。该错误发生在utterance为"001_20230623160347_0319007398_mentianyu-1"的情况下。
LOG (process-kaldi-pitch-feats[5.5]:main():process-kaldi-pitch-feats.cc:85) Post-processed pitch for 0 utterances. WARNING (paste-feats[5.5]:main():paste-feats.cc:137) Missing utt 001_20230623160347_0319007398_mentianyu-1 from input ark,s,cs:compute-kaldi-pitch-feats --verbose=2 --config=subtools/conf/pitch.conf scp,p:exp/features/mfcc/data_mfcc_23_pitch_seg/log/wav_seg.1.scp ark:- | process-kaldi-pitch-feats ark:- ark:- |
这些日志信息是与Kaldi语音识别工具相关的内容。第一条日志记录了处理了0个句子的后处理音高信息。第二条日志是一个警告,指示在输入的ark文件中缺少了名称为"001_20230623160347_0319007398_mentianyu-1"的句子。此警告来自paste-feats工具,该工具用于将不同的特征数据进行拼接。
阅读全文