2006牟第1期
中图分类号 :TN9l2.3 文献标 识码 :A 文章编号 :1009—2552(2006)01~【x】91—04
基于声 音信号 的特征提取方法的研究
李宏松,苏健 民,黄英来,于慧伶
(东北林业大学 ,哈尔滨 150040)
摘 要:主要介绍 了利用 MATLAB语 言对声音 文件的采集、调入和一些基 本处理 方法,对预 处
理过程及特征参数的选取做 了详细的说 明,并着重介绍 了线性预测 系数 (LPC)及其倒谱 系数
(LPCC)和 梅 尔频 率倒谱 系数 (MFCC),且 对 它们 进行 了比较 。
关键词:语音识别 ;特征提取 ;信号采集 ;LPCC;MFCC
The research on characteristics extraction based on voice signal
LI Hong—song,SU Jian—min,HUANG Ying—lai,YU }lui—ling
(Northeast Forestry University,Harbin 150040,China)
Abstract: This thesis not only introduces some basic processing methods of collecting and loading voice mes--
sages using MATLAB language,also explains the choice of operation processes an d characteristic parameter in
detail.And this paper also mainly gives a clear explan ation of LPC,LPCC and MFCC an d makes a contrast
between them .
Key words:vdice recognition;characteristics extraction;signal collection;LPCC;MFCC
0 引言
语音识别是以声音为研究对象 ,它是语音信号处
理的一个重要 研究 方 向。是模式识 别的 一个分支 ,涉
及到生理学 、心理学、语言学 、计算机科学 以及信号处
理等诸多领域 ,甚至还涉及到人的体态语言(如人在
说话时的表情 、手势等行为动作可帮助对方理解 ),其
最终 目标是实现人与机器进行 自然语言通信…。
语音识别的一个根本问题是合理的选用特征。
选择的标准应体现对于异字音 ,相应特征间的距离
应大 ,而对于同字音,彼此间距离应小。若以前者距
离与后者距离之比作为优化准则用 的“目标 量”_2 J,
则应使此量最大。
浯音信号的特征 向量一般分为两类 :第一类为
时域特征向量 。通常将 帧语音信号的各个时域 采样
值直接构成一个 向量。第 二类为变换域特征向量 ,
即对 一帧语音信号进行某种变换后产生 的特 征向
最。前者的优点在于计算简单 ,缺点是不能压缩维
数且 不适于表征幅度谱特性 。 与此对 应 ,各种变换
域特征向量的计算 比较复杂,但能从不同的角度反
映幅度谱的特征。
1 语 音识别原理
I璺l 1 语 晋 识 别 的 原 理框 图
语音识别本质上是一种模式识别 的过程 ,其基
本结构原理框图如图 1所示 ,主要包括语音 信号预
处理 、特征提取 、特征建模 (建立参考模式库 )、模式
匹配等几个功 能模块 。
一
个语音识别系统主要包括训练和识别两个阶
段。无论是训练还是识 别,都需要首先对输 入的原
始语音进行预处理 ,并进行特征提取。
收稿 日期 :2005—09—06
作者简 介:李卫:松 .男 ,尔北 林 - 大 学 倩 息 与计 算 机工 程 学 院 本
科,I
一
9l 一
维普资讯 http://www.cqvip.com