分层采样粒子滤波提升说话人跟踪精度

需积分: 5 144 浏览量更新于2024-08-11 收藏 424KB PDF 举报

本文主要探讨了一种基于分层采样粒子滤波的说话人跟踪方法，发表于2009年7月的大连理工大学学报。论文作者侯代文和殷福亮针对说话人语音定位与跟踪问题提出了创新的解决方案。在传统的语音处理领域，特别是电视电话会议系统、视频监控系统中的摄像头自动导引、远距离说话人语音识别以及计算机人机接口和机器人导航等方面，准确的说话人定位至关重要。该方法的核心是利用分层采样策略，结合波达方向和时间延迟两种不同的观测信息。波达方向是指通过麦克风阵列接收信号的方向，而时间延迟则是指信号从声源到达不同麦克风的时间差。这两种信息对于说话人位置的估计精度有着显著差异。作者注意到这一点，通过将基于波达方向滤波得到的状态后验概率密度函数作为时间延迟滤波的重要性采样函数，优化了采样过程。通过这种方法，重要性概率密度函数与后验概率密度函数的相似度得以增强，从而提高重要性概率密度函数的质量，降低采样粒子权值的方差。这样，就能更有效地估计说话人的位置，减少因房间混响、噪声干扰等非理想条件导致的虚声源错误估计。这种方法的优势在于它能够在复杂环境中提高定位精度，从而提高整个系统的性能。实验部分通过仿真实验验证了这种分层采样粒子滤波方法的有效性，展示了其在实际应用场景中的优越性能。该研究不仅对理论分析有所贡献，也为语音信号处理领域的实际应用提供了一种有效的技术手段。这篇文章在说话人跟踪技术上引入了新颖的分层采样策略，通过优化粒子滤波算法，提升了位置估计的精确度和鲁棒性，为解决实际环境中说话人跟踪问题提供了新的思路和方法。

第

卷第

期

2009

年

月

大连理工大学学报

Journal of Dalian University of Technology

Vol.49,

No.4

July 2 0 0 9

电曲宵夜

曲程事

量工事

业理事

业管带

业、事

业程事

业工

齿启事

业信事

由与事

业子带

世电事

却也明来

文章编号:

1000-8608(2009)04-0580-07

基于分层采样粒子滤波的说话人跟踪方法

侯代文1，

殷福亮势陈

主去

øτ2

(

1.大连理工大学电子与信息工程学院，辽宁大连

116024;

海军试验基地，辽宁大连

116041

)

摘要:利用分层采样方法，融合波达方向和时间延迟两种信息，实现了对说话人的定位与跟

踪.分层采样方法考虑波达方向和时间延迟这两种不同观测信息对说话人位置估计精度的差

异，将基于波达方向滤波得到的状态后验概率密度函数作为基于时间延迟滤波的重要性采样

函数，增强了重要性概率密度函数与后验概率密度函数的相似程度，从而改善了重要性概率

密度函数的质量，减小了采样粒子权值的方差，提高了对说话人位置的估计精度.仿真实验验

证了该方法的有效性.

关键词:说话人跟踪;粒子滤波;波达方向估计;时间延迟估计;分层采样

中图分类号:

TN713

文献标志码

。弓

气主云·

日

说话人语音定位与跟踪问题是语音信号处理

领域的重要课题之一，它可以广泛应用于电视电

话会议系统、视频监控系统中的摄像头自动导引、

远距离说话人语音识别、计算机人机接口以及机

器人导航等场合[l

说话人定位与跟踪是根据麦克风阵列接收到

的说话人语音信息以及说话人的运动规律，实时

估计说话人位置的技术.经常使用的定位方法主

要有波束形成方法和时延估计方法

、

波束形

成方法通过改变麦克风阵列的指向模式，将各麦

克风接收到的信号"导向"某一方向，然后在信号

空间内搜索能够使期望信号输出功率最大的方

向，就认为是说话人所在方向.时延估计方法首先

确定一组麦克风对之间的时间延迟，再通过求解

一组非线性双曲面方程，得到说话人位置.上述两

种方法在自由声场条件下，都能够实现对说话人

的准确定位.然而在实际应用中，由于房间混响、

噪声干扰等因素的影响，有可能产生虚声源，此时

采用上述方法，会导致对说话人位置的错误估计.

Sturim

等四提出利用状态空间方法解决这一问

题，该方法通过建立动态方程，在估计说话人当前

位置时，不仅利用当前观测信息，而且利用当前时

刻之前的全部信息，因此能够滤除观测序列中具

有明显误差的观测量，从而在一定程度上解决了

说话人跟踪中的虚声源问题.以此为基础，

Dvorkind

等问利用卡尔曼滤波器跟踪说话人位

置，解决了虚声源问题.然而，在非高斯观测噪声

条件下，使用卡尔曼滤波方法所得估计结果偏差

较大.考虑到粒子滤披方法具有较强的处理非线

性、非高斯问题的能力，飞

lermaak

等

和

Ward

等

[7J

采用粒子滤波器

、

进行说话人跟踪，改善了

说话人跟踪的效果.但这两种方法均选用先验分

布作为重要性概率密度函数，由于粒子采样效率

低，常常会出现粒子匮乏现象，导致状态估计精度

降低.

为了实现对说话人的准确定位与跟踪，本文

提出基于波达方向和时间延迟的说话人联合跟踪

粒子滤波方法，并利用仿真实验对本文方法的有

效性进行验证.

粒子滤波方法

考虑说话人跟踪问题，系统状态方程和观测

收稿日期:

2007-07-02;

修回日期:

2009-05-13.

基金项目·国家自然科学基金资助项目

(60772161

，

60372082);

高等学校博士学科点专项科研基金资助项目

(200801410015)

，

作者简介:侯代文

0972-)

，男，博士，巴

mail:

hodevin@gmaiL

∞

殷福亮.

0962-)

，男，教授，博士生导师

.E-mail:flyin@dlut.ed

u.cn.

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38741996

粉丝: 45
资源: 932

分层采样粒子滤波提升说话人跟踪精度

pf_samples.rar_PF 导航_滤波制导_目标跟踪采样_粒子滤波_粒子滤波 图像

粒子滤波slam_particle_ekf.rar

一种改进的粒子滤波检测前跟踪算法

粒子滤波中系统重采样流程

粒子滤波四种基本重采样性能分析

KLD粒子滤波方法代码实现

粒子滤波四种基本重采样代码

粒子滤波四种基本重采样实例代码

MATLAB中分层采样方法

pyspark dataframe 分层采样

最新资源

pf_samples.rar_PF 导航_滤波制导_目标跟踪采样_粒子滤波_粒子滤波图像