梅尔频率倒谱系数（mfcc）及Python实现 - CSDN文库

梅尔频率倒谱系数

156 浏览量更新于2023-03-16 3 收藏 96KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源推荐

梅尔频率倒谱系数（梅尔频率倒谱系数（mfcc）及）及Python实现实现

主要为大家详细介绍了语音识别之梅尔频率倒谱系数及Python实现，具有一定的参考价值，感兴趣的小伙伴们

可以参考一下

语音识别系统的第一步是进行特征提取，mfcc是描述短时功率谱包络的一种特征，在语音识别系统中被广泛应用。

一、一、mel滤波器滤波器

每一段语音信号被分为多帧，每帧信号都对应一个频谱（通过FFT变换实现），频谱表示频率与信号能量之间的关系。mel滤

波器是指多个带通滤波器，在mel频率中带通滤波器的通带是等宽的，但在赫兹（Hertz）频谱内mel滤波器在低频处较密集切

通带较窄，高频处较稀疏且通带较宽，旨在通过在较低频率处更具辨别性并且在较高频率处较少辨别性来模拟非线性人类耳朵

对声音的感知。

赫兹频率和梅尔频率之间的关系为：

假设在梅尔频谱内，有M 个带通滤波器Hm (k),0≤m<M，每个带通滤波器的中心频率为F(m) F(m)F(m)每个带通滤波器的传递

函数为：

下图为赫兹频率内的mel滤波器，带通滤波器个数为24：

二、二、mfcc特征特征

MFCC系数提取步骤：

（1）语音信号分帧处理

（2）每一帧傅里叶变换---->功率谱

（3）将短时功率谱通过mel滤波器

（4）滤波器组系数取对数

（5）将滤波器组系数的对数进行离散余弦变换（DCT）

（6）一般将第2到底13个倒谱系数保留作为短时语音信号的特征

Python实现

import wave

import numpy as np

import math

import matplotlib.pyplot as plt

from scipy.fftpack import dct

def read(data_path):

'''读取语音信号

'''

wavepath = data_path

f = wave.open(wavepath,'rb')

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38735182

粉丝: 5
资源: 920

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈