MATLAB语音特征提取：LPC、LPCC与MFCC的深入比较

需积分: 50 93 浏览量更新于2024-09-11 3 收藏 284KB PDF 举报

本文主要探讨了基于声音信号的特征提取方法在语音识别领域的应用，以MATLAB语言作为工具平台。作者首先概述了语音识别的重要性和其跨学科的广泛性，强调了合理选择特征参数对于语音识别系统性能的关键作用。在技术层面上，文章详细介绍了声音文件的采集和导入过程，包括如何使用MATLAB进行数据处理，确保声音信号的质量和准确性。预处理步骤在这个过程中扮演着至关重要的角色，它涵盖了噪声抑制、信号增强、同步和采样率调整等内容，这些都是为了减少干扰并提取有效特征。文章的核心部分着重介绍了几种常见的声音特征提取算法，首先是线性预测系数(LPC)，这是一种用于量化语音信号频域特性的方法，通过对信号的线性预测误差进行分析，可以获取声音的频谱信息。LPC在语音识别中的应用有助于描述语音的连续性，因为它能够反映声道的动态特性。接着，作者介绍了倒谱系数(LPCC)，它是LPC的扩展，更侧重于非平稳信号的处理，提供了更丰富的频谱信息。LPCC通过计算信号的自相关函数来捕捉声音的时变特性，这对识别具有变化音调或语速的语音尤其有用。此外，文章还讨论了梅尔频率倒谱系数(MFCC)，这是一种更为常用的声音特征提取方法，它将人类听觉系统的感知模型引入到特征计算中。MFCC通过将频率轴转换成人耳感知的梅尔频率，再计算每个频段的倒谱，从而提取出更为接近语音自然特性的特征。MFCC由于其在实际应用中的鲁棒性和有效性，被广泛应用在许多语音识别系统中。通过对LPC、LPCC和MFCC的详细介绍和对比，文章旨在帮助读者理解不同特征提取方法的优势和适用场景，以便在实际应用中根据需求做出合适的选择。这篇文章为语音信号处理领域的研究人员和开发者提供了一个全面而深入的指南，对于提高语音识别系统的性能具有很高的参考价值。

２００６牟第１期　

中图分类号：ＴＮ９ｌ２．３　文献标识码：Ａ　文章编号：１００９—２５５２（２００６）０１～【ｘ】９１—０４　

基于声音信号的特征提取方法的研究　

李宏松，苏健民，黄英来，于慧伶　

（东北林业大学，哈尔滨１５００４０）　

摘要：主要介绍了利用ＭＡＴＬＡＢ语言对声音文件的采集、调入和一些基本处理方法，对预处　

理过程及特征参数的选取做了详细的说明，并着重介绍了线性预测系数（ＬＰＣ）及其倒谱系数　

（ＬＰＣＣ）和梅尔频率倒谱系数（ＭＦＣＣ），且对它们进行了比较。　

关键词：语音识别；特征提取；信号采集；ＬＰＣＣ；ＭＦＣＣ　

Ｔｈｅ　ｒｅｓｅａｒｃｈ　ｏｎ　ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ　ｅｘｔｒａｃｔｉｏｎ　ｂａｓｅｄ　ｏｎ　ｖｏｉｃｅ　ｓｉｇｎａｌ　

ＬＩ　Ｈｏｎｇ—ｓｏｎｇ，ＳＵ　Ｊｉａｎ—ｍｉｎ，ＨＵＡＮＧ　Ｙｉｎｇ—ｌａｉ，ＹＵ｝ｌｕｉ—ｌｉｎｇ　

（Ｎｏｒｔｈｅａｓｔ　Ｆｏｒｅｓｔｒｙ　Ｕｎｉｖｅｒｓｉｔｙ，Ｈａｒｂｉｎ　１５００４０，Ｃｈｉｎａ）　

Ａｂｓｔｒａｃｔ：Ｔｈｉｓ　ｔｈｅｓｉｓ　ｎｏｔ　ｏｎｌｙ　ｉｎｔｒｏｄｕｃｅｓ　ｓｏｍｅ　ｂａｓｉｃ　ｐｒｏｃｅｓｓｉｎｇ　ｍｅｔｈｏｄｓ　ｏｆ　ｃｏｌｌｅｃｔｉｎｇ　ａｎｄ　ｌｏａｄｉｎｇ　ｖｏｉｃｅ　ｍｅｓ－－　

ｓａｇｅｓ　ｕｓｉｎｇ　ＭＡＴＬＡＢ　ｌａｎｇｕａｇｅ，ａｌｓｏ　ｅｘｐｌａｉｎｓ　ｔｈｅ　ｃｈｏｉｃｅ　ｏｆ　ｏｐｅｒａｔｉｏｎ　ｐｒｏｃｅｓｓｅｓ　ａｎｄ　ｃｈａｒａｃｔｅｒｉｓｔｉｃ　ｐａｒａｍｅｔｅｒ　ｉｎ　

ｄｅｔａｉｌ．Ａｎｄ　ｔｈｉｓ　ｐａｐｅｒ　ａｌｓｏ　ｍａｉｎｌｙ　ｇｉｖｅｓ　ａ　ｃｌｅａｒ　ｅｘｐｌａｎａｔｉｏｎ　ｏｆ　ＬＰＣ，ＬＰＣＣ　ａｎｄ　ＭＦＣＣ　ａｎｄ　ｍａｋｅｓ　ａ　ｃｏｎｔｒａｓｔ　

ｂｅｔｗｅｅｎ　ｔｈｅｍ．　

Ｋｅｙ　ｗｏｒｄｓ：ｖｄｉｃｅ　ｒｅｃｏｇｎｉｔｉｏｎ；ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ　ｅｘｔｒａｃｔｉｏｎ；ｓｉｇｎａｌ　ｃｏｌｌｅｃｔｉｏｎ；ＬＰＣＣ；ＭＦＣＣ　

０　引言　

语音识别是以声音为研究对象，它是语音信号处　

理的一个重要研究方向。是模式识别的一个分支，涉　

及到生理学、心理学、语言学、计算机科学以及信号处　

理等诸多领域，甚至还涉及到人的体态语言（如人在　

说话时的表情、手势等行为动作可帮助对方理解），其　

最终目标是实现人与机器进行自然语言通信…。　

语音识别的一个根本问题是合理的选用特征。　

选择的标准应体现对于异字音，相应特征间的距离　

应大，而对于同字音，彼此间距离应小。若以前者距　

离与后者距离之比作为优化准则用的“目标量”＿２　Ｊ，　

则应使此量最大。　

浯音信号的特征向量一般分为两类：第一类为　

时域特征向量。通常将帧语音信号的各个时域采样　

值直接构成一个向量。第二类为变换域特征向量，　

即对一帧语音信号进行某种变换后产生的特征向　

最。前者的优点在于计算简单，缺点是不能压缩维　

数且不适于表征幅度谱特性。与此对应，各种变换　

域特征向量的计算比较复杂，但能从不同的角度反　

映幅度谱的特征。　

１　语音识别原理　

Ｉ璺ｌ　１语晋识别的原理框图　

语音识别本质上是一种模式识别的过程，其基　

本结构原理框图如图１所示，主要包括语音信号预　

处理、特征提取、特征建模（建立参考模式库）、模式　

匹配等几个功能模块。　

一

个语音识别系统主要包括训练和识别两个阶　

段。无论是训练还是识别，都需要首先对输入的原　

始语音进行预处理，并进行特征提取。　

收稿日期：２００５—０９—０６　

作者简介：李卫：松．男，尔北林－　大学倩息与计算机工程学院本　

科，Ｉ　

一

９ｌ一　

维普资讯 http://www.cqvip.com

下载后可阅读完整内容，剩余3页未读，立即下载

天行无常

粉丝: 1
资源: 4

MATLAB语音特征提取：LPC、LPCC与MFCC的深入比较

用matlab实现对语音信号的特征进行特征提取.rar_matlab_matlab语音识别_信号识别_语音特征_语音识别

matlab-基于声音信号mfcc特征提取算法的音乐检索系统MATLAB仿真-源码

MFCC_success.zip_Success_matlab 声音_mfcc特征提取_声音信号_声音特征提取

基于谐波恢复方法的直升机声信号特征提取.pdf

tzextraction.rar_信号特征提取_特征提取 matlab_特征提取MATLAB

基于matlab的心音信号特征提取分析系统设计.zip

基于CNN的动物声音信号识别与MFCC特征提取研究

基于King信号分割的图像特征提取与数据采集方法

基于Matlab的羊寻母声音信号识别：特征提取与应用

Matlab中信号特征提取方法解析

最新资源