python实现mfcc

MFCC（Mel频率倒谱系数）是一种常用的语音信号特征提取方法，下面是Python实现MFCC的示例代码： ```python import numpy as np from scipy.fftpack import dct def pre_emphasis(signal, pre_emphasis_coeff=0.97): # 预加重 return np.append(signal[0], signal[1:] - pre_emphasis_coeff * signal[:-1]) def framing(signal, frame_length, frame_step, window_func=None): # 分帧 signal_length = len(signal) frame_size = int(frame_length * signal_length) step_size = int(frame_step * signal_length) num_frames = int(np.ceil(float(np.abs(signal_length - frame_size)) / step_size)) padding_size = num_frames * step_size + frame_size padding_signal = np.append(signal, np.zeros(padding_size - signal_length)) indices = np.tile(np.arange(0, frame_size), (num_frames, 1)) + np.tile(np.arange(0, num_frames * step_size, step_size), (frame_size, 1)).T frames = padding_signal[indices.astype(np.int32, copy=False)] if window_func is not None: frames *= window_func(frame_size) return frames def power_spectrum(frames, nfft): # 计算功率谱 magnitude_spectrum = np.abs(np.fft.rfft(frames, n=nfft)) return (1.0 / nfft) * np.square(magnitude_spectrum) def mel_filter_bank(num_filters, nfft, sampling_rate, low_freq, high_freq): # 计算Mel滤波器组 low_mel = 1127 * np.log(1 + low_freq / 700) high_mel = 1127 * np.log(1 + high_freq / 700) mel_points = np.linspace(low_mel, high_mel, num_filters + 2) hertz_points = 700 * (np.exp(mel_points / 1127) - 1) bin = np.floor((nfft + 1) * hertz_points / sampling_rate) fbank = np.zeros((num_filters, int(np.floor(nfft / 2 + 1)))) for j in range(0, num_filters): for i in range(int(bin[j]), int(bin[j + 1])): fbank[j, i] = (i - bin[j]) / (bin[j + 1] - bin[j]) for i in range(int(bin[j + 1]), int(bin[j + 2])): fbank[j, i] = (bin[j + 2] - i) / (bin[j + 2] - bin[j + 1]) return fbank def mfcc(signal, sampling_rate, num_filters=26, ncoeff=13, nfft=512, frame_length=0.025, frame_step=0.01, pre_emphasis_coeff=0.97, window_func=np.hamming): # 计算MFCC signal = pre_emphasis(signal, pre_emphasis_coeff) frames = framing(signal, frame_length, frame_step, window_func) pspec = power_spectrum(frames, nfft) fbank = mel_filter_bank(num_filters, nfft, sampling_rate, 0, sampling_rate / 2) feat = np.dot(pspec, fbank.T) feat = np.where(feat == 0, np.finfo(float).eps, feat) feat = np.log(feat) feat = dct(feat, type=2, axis=1, norm='ortho')[:, 1 : (ncoeff + 1)] return feat ``` 这里的`signal`是输入的语音信号，`sampling_rate`是采样率，`num_filters`是Mel滤波器组的数量，`ncoeff`是MFCC系数的数量，`nfft`是FFT的点数，`frame_length`是帧长（以秒为单位），`frame_step`是帧移（以秒为单位），`pre_emphasis_coeff`是预加重系数，`window_func`是窗函数（默认为Hamming窗）。这个函数返回一个`ncoeff`行的矩阵，每行代表一个MFCC系数。

阅读全文

相关推荐

python提取MFCC

梅尔频率倒谱系数（mfcc）及Python实现

对Python使用mfcc的两种方式详解

基于MATLAB和Python实现MFCC特征参数提取.doc

Python实现MFCC特征提取程序详解

python实现MFCC计算

请详解如何使用Python实现MFCC算法来提取语音信号特征，并结合自动语音识别（ASR）进行处理？

mfcc.zip_MFCC_mfcc in python_mfcc python_python mfcc_scale

Python_MFCC-DTW.rar_MFCC_dtw_dtw模板训练_mfcc python_语音 python

Python Librosa MFCC步骤深度解析

如何使用Python结合MFCC和TensorFlow实现音频特征提取和分类？请结合《Python提取MFCC特征并用TensorFlow预测音频类别的实践》资源进行详细说明。

在音频分类任务中，如何利用Python结合MFCC和TensorFlow实现音频特征提取和分类？请结合《Python提取MFCC特征并用TensorFlow预测音频类别的实践》资源进行详细说明。

python LSTM MFCC

MFCC.rar_MFCC_P6W_feature_python mfcc_python mfcc图

yuhuimin_opensmilePython_opensmile_python_MFCC_

Python提取MFCC特征并用TensorFlow预测音频类别的实践

mfcc源代码

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

大家在看

Unity游戏源码分享-3d机器人推箱子游戏

BCM53333-DS06-R.pdf

欧姆龙编码器E6B2-CWZ6C

GMW14241-中文翻译

郑轻大计通院考研专业课考纲.pdf

最新推荐

梅尔频率倒谱系数（mfcc）及Python实现

使用python实现语音文件的特征提取方法

免费的防止锁屏小软件，可用于域统一管控下的锁屏机制

Python代码实现带装饰的圣诞树控制台输出

白色大气风格的设计师作品模板下载.zip

掌握HTML/CSS/JS和Node.js的Web应用开发实践

管理建模和仿真的文件

计算机体系结构概述：基础概念与发展趋势

int a[][3]={{1,2},{4}}输出这个数组

勒玛算法研讨会项目：在线商店模拟与Qt界面实现