C语言实现MFCC特征提取

4星 · 超过85%的资源需积分: 49 66 浏览量更新于2024-09-11 2 收藏 14KB TXT 举报

"这是一个C语言实现的MFCC (Mel Frequency Cepstral Coefficients) 工具，包含了mfcc.c和mfcc.h两个文件，用于音频信号的特征提取。MFCC是语音识别和处理中常用的一种技术，通过该程序可以将原始音频信号转化为具有代表性的特征向量。" MFCC（梅尔频率倒谱系数）是一种在语音识别、音频分析等领域广泛应用的信号处理技术。它通过模拟人类听觉系统对声音的感知，将声音信号转换成一组易于处理的系数，这些系数能够捕获声音的主要特征。在提供的代码中，可以看到以下几个关键步骤： 1. **预加重(preemphasis)**：预加重是为了补偿人类听觉系统对高频成分的衰减，提高低频成分的相对强度。函数`preemphasize`中，使用了一种线性滤波器，通常设置一个固定的预加重因子`emphFac`（例如0.97），对输入信号进行处理。预加重公式为`sample[i] = sample[i] - emphFac * sample[i-1]`。 2. **窗口函数应用(windowing)**：在函数`Do_hamm_window`中，使用了汉明窗（Hann window）对每一帧信号进行加权。汉明窗能减少信号处理中的边界效应，使处理结果更加平滑。窗函数计算公式为`hamm_window[i] = 0.54 - 0.46 * cos(temp * i)`，其中`temp`是根据窗口大小计算的角频率。 3. **分帧(frame segmentation)**：将音频信号分割成固定长度的帧，以便于处理。通常会根据采样率和帧移（frame shift）来确定每帧的样本数。 4. **短时能量计算和对数能量(log energy calculation)**：这是MFCC的第一步，计算每帧的短时能量，然后取对数。在代码中，这部分可能隐藏在未显示的部分，如`m_logEnergyFloor`和`m_energyFloor`可能用于设定能量的下限，避免对数运算时出现负值。 5. **梅尔滤波器组(Mel Filterbank)**：函数`WfMelFBm_MelFB`可能表示梅尔滤波器组的设置，用于将功率谱映射到梅尔频率尺度上。梅尔滤波器通常有20到40个，代码中设置了23个。 6. **倒谱(DCT, Discrete Cosine Transform)**：使用离散余弦变换将梅尔滤波器组输出的频谱转换为倒谱系数。在`m_dctMatrix`中存储了DCT矩阵，用于执行DCT操作。 7. **选择保留系数(cepsTruncate)**：通常只保留MFCC的前几个系数（例如12个，如变量`m_cepOrder`所示），因为它们包含主要的语音信息，其余系数可以丢弃以减少计算复杂性和存储需求。 8. **其他可能的步骤**：包括Dithering（抖动）等，用于改善量化噪声，但代码中注释掉了。这个C程序提供了一个完整的MFCC提取流程，可以用于各种音频处理任务，例如语音识别、情感分析或音频分类。在实际应用中，可能还需要添加额外的步骤，如帧重叠、去直流偏移、归一化等，以优化结果。

mfcc.c

#include "mfcc.h"
#include <math.h>
#include <stdio.h>

int m_cepOrder = 12;
int m_fbOrder = 23;
float m_dctMatrix[(12+1)*23];
int m_sampleRate=32000;
WfMelFB m_MelFB[23];
float m_MelWeight[512/2+1];
float m_logEnergyFloor;
float m_energyFloor;

int preemphasize(float *sample, int sampleN)
{
/* Setting emphFac=0 turns off preemphasis. */
int i;
float emphFac = (float)0.97;

for (i = sampleN-1; i > 0; i--) {
sample[i] = sample[i] - emphFac * sample[i-1];
}
sample[0] = (float)(1.0 - emphFac) * sample[0];

return(1);
}

int preprocessing(short *sample, int sampleN, float *out)

剩余12页未读，继续阅读

liting881227

粉丝: 0
资源: 1

C语言实现MFCC特征提取

基于C语言的MFCC特征提取程序

基于C语言实现的MFCC语音识别程序

MFCC特征提取详解：声音信号的数字化处理

MFCC.rar_C语言mfcc_MFCC_mfcc c语言_语音特征_语音特征 C

mfcc的c语言

mfcc参数的C程序实现

STM32计算音频特征参数MFCC示例程序

mfcc.zip_MFCC_mfcc仿真_mfcc提取工具_mfcc数据库_mfcc构建c_l样本

CLEAN_MFCC_STD.rar_mfcc c_mfcc特征_mfcc特征提取_声音特征提取_特征提取

MFCC特征提取C++源程序

最新资源