利用抗噪幂归一化倒谱系数的鸟类声音识别
颜 鑫,李 应
(福州大学数学与计算机科学学院,福建福州
350108
)
摘 要: 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音
识别技术
.
首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱
.
其次,使用多频带谱减法对声音功率
谱进行降噪处理
.
接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(
APNCC
)
.
最后,采用支持向量机(
SVM
)分
别对提取的
APNCC
,幂归一化倒谱系数(
PNCC
)和
Mel
频率倒谱系数(
MFCC
)对
34
种鸟类声音进行不同环境和信噪比
情况下的对比实验
.
实验表明,提取的
APNCC
具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于
30dB
环境下的鸟类声音识别
.
关键词: 鸟类声音识别;非平稳噪声估计;多频带谱减法;抗噪幂归一化倒谱系数;
Mel
频率倒谱系数
中图分类号:
TP3914
文献标识码:
A
文章编号:
03722112
(
2013
)
02029506
电子学报
URL
:
http
:
//www.ejournal.org.cn DOI
:
10.3969/j.issn.03722112.2013.02.014
AntiNoisePowerNormalizedCepstralCoefficientsinBirdSoundsRecognition
YANXin
,
LIYing
(
CollegeofMathematicsandComputerScience
,
FuzhouUniversity
,
Fuzhou
,
Fujian350108
,
China
)
Abstract
:
Inordertoimprovetheaccuracyofbirdsoundsrecognitionunderdifferentkindsofnoiseenvironmentsinthereal
world
,
anewbirdsoundsrecognitiontechnologybasedontheAPNCCextractionwasproposed.First
,
thenoiseestimationalgorithm
forhighlynonstationaryenvironmentswasusedtoestimatethenoisepowerspectrumofthebirdsoundinthenoiseenvironment.
Second
,
themultibandspectralsubtractionwaspresentedtoachievethebackgroundnoisereduction.Then
,
theestimatedcleanbird
soundspectrumwascombinedwiththeprocessofthePNCCextractiontocalculatetheAPNCC.Finally
,
thecomparisonexperiments
of34birdsoundsrecognitionin3differentrealenvironmentsunderdifferentSNRswereconstructed
,
basedonthecombinationof
theSVM classifierand3differentfeatures
,
namelytheAPNCC
,
PNCCandMFCC.TheexperimentalresultsshowthattheAPNCC
outperformsotherfeaturesintheaveragerecognitionrateandthenoiserobustness
,
especiallyfortheconditionsofallSNRslower
than30dB.
Keywords
:
birdsoundsrecognition
;
nonstationarynoiseestimation
;
multibandspectralsubtraction
;
antinoisepowernor
malizedcepstralcoefficients
(
APNCC
);
Melfrequencycepstralcoefficients
(
MFCC
)
1
引言
生态环境下的鸟类声音包含着丰富的信息,鸟类声
音识别不仅可以分析鸟类本身的行为等特征,而且可以
对与鸟类有关的外界环境及相关影响领域做分析
.
近年来,借鉴较为成熟的语音识别技术,鸟类声音
识别领域取得了丰富的成果
.
文献[
1
]通过分析鸟类声
音音节对的柱状图来进行鸟叫声的分类
.
文献[
2
]使用
MFCC
及高斯混合模型(
GaussianMixtureModel
,
GMM
)进
行不依赖于个体叫声变化的四种雀形目鸟类声音识别
.
滤除背景噪声一直是信号处理领域的基本问题
[
3
]
,在真
实环境中,各种噪声是普遍存在的
.
因此,对于噪声环境
下的鸟类声音识别具有重要的现实意义
.
文献[
4
]通过
对基于帧线性预测编码(
LinearPredictiveCoding
,
LPC
)的
聚类,提取噪声下欧亚鸲声音段的有效音节并结合隐马
尔可夫模型(
HiddenMarkovModel
,
HMM
)进行分类
.
文献
[
5
]使用谱减法,功率谱分析及自相关分析对噪声下的
两种鸟叫进行识别
.
环境中的噪声具有非平稳特性,大多数方法主要针
对特定的噪声环境进行鸟类声音识别,并没有提出一种
普遍适用于各种噪声下的鸟类声音识别方法
.
因此,本
文提出一种非平稳噪声功率谱估计,多频带谱减法与
收稿日期:
20120517
;修回日期:
20120928
基金项目:国家自然科学基金(
No.61075022
)
第
2
期
2013
年
2
月
电 子 学 报
ACTAELECTRONICASINICA
Vol.41 No.2
Feb. 2013