没有合适的资源?快使用搜索试试~ 我知道了~
首页基于时频谱图的声学部件检测提升自动物种识别精度10%
基于时频谱图的声学部件检测提升自动物种识别精度10%
需积分: 17 5 下载量 2 浏览量
更新于2024-09-02
1
收藏 465KB PDF 举报
自动物种识别在环境监测中的应用日益受到重视,因为它可以作为衡量生物多样性、丰富度和生态环境健康的重要指标。本文主要探讨了利用时频谱图形状进行声学部件检测的新方法,这对于准确识别动物叫声至关重要。作者创新性地将可听的声音信号通过快速傅里叶变换转化为可视的时频谱图,这种转化使得复杂的声学特征能够直观地展示出来。 文章详细介绍了三种基于时频谱图形状的声学部件检测算法:warble(颤音)、stacked harmonic(叠置谐波)和oscillation(振动)。Warble检测关注的是叫声中的不规则周期变化,stacked harmonic则着重于分析连续的和谐音调组合,而oscillation则是捕捉叫声中的持续波动模式。通过分析母考拉叫声的实例,作者深入阐述了这三种算法的工作原理,并将其识别结果与Raven和Song Scope两种现有工具进行了对比。 实验结果显示,相比于Raven和Song Scope,本文提出的这三种算法在识别精度方面显著提升,达到了10%。这一改进表明,通过时频谱图形状分析,可以更精确地识别出不同动物的叫声特征,从而提高自动物种识别的准确性,为环境保护和生物多样性研究提供了有力的技术支持。 总结来说,本文的核心贡献在于提出了一种基于时频谱图形状的声学部件检测方法,通过图像处理技术提升了自动物种识别的性能,对于环境监测和野生动物保护具有实际应用价值。未来的研究可以进一步优化这些算法,以便在更大规模和复杂环境中实现更高效的物种识别。
资源详情
资源推荐
第
4
6
卷
第
2
期
20
15
年
3
月
太原理工大学学报
JOURNAL
OF
TAIYUAN
UNIVERSITY
OF
TECHNOLOGY
Vol
.46 No.2
Mar.2015
文章编
号
:
1007
-
943
2
(
2015
)
02
-
017
6
-
07
自动物种识别中基于时频谱图
形状的声学部件检测
白
伟
1
,
段淑斐
2
(
1
.
太原广播电视大学 教学处
,
太
原
030002
;
2.
太原理工大学 信息工程学院
,
太原
030024
)
摘
要
:
概述了声音的自动物种识别在环境监测中发挥的重要的作用
,
创
新性地利用时频谱图
将可听的声音信号转换为可视的图像信号
,
并定义了构成动物叫声结构的基础声学部件
。
从图像
处理的角度出发
,
设计了
3
种基于时频谱图形状检测声学部件
w
arble
,
stacked
harmonic
和
oscilla
-
tio
n
的算法
;
通过母考拉的叫声结构详细阐述这
3
种算法
,
并将这
3
种算法的识别结果与
Raven
和
Son
g
Sco
p
e
进行了比较
。
实验结果表明
,
相较于
Raven
和
Son
g
Sco
p
e
,
本文设计的
3
种算法在识
别精度上提高了
10%
。
关
键词
:
形状
;
声学部件检测
;
时频谱图
;
自动物种识别
中图分类号
:
TN912.3
文献标识码
:
A
DOI
:
10.16355
/
j
.cnki.issn1007
-
943
2t
y
ut.2015.02.009
作为物
种多样性
、
丰富度和环境健康的一项重
要指标
,
动物叫声识别在环境监测中发挥着重要的
作用
[
1
-
2
]
。
自动物
种识别技术
,
已经在环境监测中引
起了日趋高涨的研究热情和广泛应用
。
在自动物种识别研究领域
,
时频谱图是观察和
分析动物叫声极其重要的工具
,
是快速傅里叶变换
在一个时间和频率正交二维平面上通过色彩等级或
灰度等级的幅值反映
,
可将声音信号转变成静态的
图像信号
。
通过观察动物叫声在时频谱图中呈现出
的形状结构
,
鸟类科研人员可以为不同类型鸟叫的
声音命名
[
3
]
,
为已知
物种的声音结构增加视觉记忆
,
客观地分析研究声音文件
[
4
]
。
201
1
年
,
Berwick
等人研
究了鸟叫声的句法特
征与人类语言之间存在的相似之处
[
5
]
。
研究发
现
,
从句法复杂性的角度看
,
鸟叫声是不可能与人类语
言进行类比的
,
主要是因为鸟叫声既没有语法也没
有词汇
。
虽然有一些鸟叫的句法结构呈现出
k
可逆
的正
规语言
,
但是大量鸟类叫声的结构其实可以用
低阶马尔可夫链来模 拟
。
这就意味着在很多情况
下
,
动物声音识别不需要人类强大的语言识别能力
,
用相对简单的识别器就可实现
。
因此
,
如果一些简
单的基础声学部件能够组合构成复杂的叫声结构
,
那么
,
通过应用句法模式识别技术可以把低阶马尔
可夫模式应用到识别工作
。
基于这种考虑
,
我们观察研究动物叫声的声音
结构以发现归纳出基础的声学部件
。
研究发现
,
许
多动物叫声呈多级结构
[
6
]
,
复杂的
叫声可以由一些
通用的基础元部件构成
。
对这些元部件
,
研究人员
从发声学的角度做出了一些定义
[
4
,
7
]
。
不同于
传统
的基于发声学的定义
,
我们依据动物叫声的时频谱
图形状
,
对声学部件进行定义
[
8
]
,
并对每
一部件设计
相应的检测器
。
借助于声学部件检测器
,
我们能够
应用低阶马尔可夫方法来实现自动物种识别
[
9
]
。
声学部
件是可以归属到特定声源的基本元素
。
这些部件可以组合构成大多数动物叫声结构
。
元部
件有
whi
stle
,
click
,
slur
,
warble
,
和
block
。
复合部
件
有
sta
cked
harmonic
和
oscillation
。
2011
年
,
我
们为
whistle
,
click
和
block
的检测
提出了
3
种检测
算法
[
8
]
。
检测
war
ble
,
stacked
harmonic
和
oscilla
-
tio
n
的方法
还未提及
。
本文 的 研 究 对 象 是
war
ble
,
stacked
harmonic
和
oscillation
的声音
结构
。
目的是对
3
种声学部件
分别设计检测器
,
并将这
3
种检测器与自动物种识
别 领 域 中 广 泛 应 用 的 基 准 软 件
Rav
en
和
Son
g
*
收稿日
期
:
201
4
-
10
-
20
基
金项
目
:
太原理工大学第四层次引进人才科研启动金
(
t
y
ut
-
rc2
01405b
)
作
者简
介
:
白伟
(
198
0-
),
男
,
山西太
原人
,
硕士
,
讲师
,
主要从事信号处理
、
语音识别研究
,(
Tel
)
18035103381
,
(
E
-
mai
l
)
39736632
@
qq
.com
通
讯联
系人
:
段淑斐
(
198
3-
),
女
,
博士
,(
Tel
)
15834154405
,(
E
-
mai
l
)
research
_
xxx
y
1
@
163.com
中国煤炭期刊网
www.chinacaj.net
下载后可阅读完整内容,剩余6页未读,立即下载
weixin_38717870
- 粉丝: 2
- 资源: 908
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功