利用利用MEMS麦克风阵列定位并识别音频或语音信源的技术方案麦克风阵列定位并识别音频或语音信源的技术方案
1.前言 自动语音识别、语音模式识别和说话人识别及确认等应用对噪声十分敏感,信源定位识别是音频和语
音信号捕捉处理应用的一个关键的预处理功能。特别是基于微机电系统(MEMS) 的麦克风阵列出现后,麦克风
阵列音频定位方案引起科研企业和开发人员的广泛关注。 目前业界正在使用MEMS麦克风阵列子系统开发
嵌入式音频定位、自动语音识别和自动说话人识别解决方案,声音识别定位是我们识别确认他人身份的基本功
能,当我们听到有人讲话时,会将头转向说话人,查看说话人。 音源定位是自动语音识别和自动说话人识
别系统的一个重要环节,对于提高语音识别系统的性能至关重要。麦克风阵列可捕捉从不同方向传来的声音,
通过算法运算
1.前言
自动语音识别、语音模式识别和说话人识别及确认等应用对噪声十分敏感,信源定位识别是音频和语音信号捕捉处理应用
的一个关键的预处理功能。特别是基于微机电系统(MEMS) 的
麦克风
阵列出现后,
麦克风
阵列音频定位方案引起科研企业和开
发人员的广泛关注。
目前业界正在使用MEMS
麦克风
阵列子系统开发嵌入式音频定位、自动语音识别和自动说话人识别解决方案,声音识别定
位是我们识别确认他人身份的基本功能,当我们听到有人讲话时,会将头转向说话人,查看说话人。
音源定位是自动语音识别和自动说话人识别系统的一个重要环节,对于提高语音识别系统的性能至关重要。麦克风阵列可
捕捉从不同方向传来的声音,通过算法运算使麦克风指向某一个特定方向,放大从该方向捕捉到的音频信号,同时衰减从其它
方向捕捉的音频信号,整个动作就像一个智能麦克风。
图 1.综合利用麦克风音源互相关性(CC)、相变(PHAT)和最大相似性处理(ML)技术的音源定位
2.系统框架
整个系统由以下几个子系统组成:音源方向测定、数据融合、自动语音识别和自动说话人确认。其中,音频方向测定子系
统基于麦克风阵列,运行三个不同的音频方向估算算法;数据融合子系统负责推断方向,自动语音识别子系统利用传入的音频
信号增强主音源信号强度,衰减主音源周围的其它音频信号。最后,自动说话人确认子系统识别某些关键词汇,再利用相关特
征与说话人匹配。
评论0