等边三角麦克风阵列的多声源语音分离技术

需积分: 9 5 下载量 7 浏览量 更新于2024-09-09 收藏 570KB PDF 举报
本文主要探讨了一种基于等边三角形麦克风阵列的声源分离方法,由张健和付中华两位作者提出,他们的研究得到了国家自然科学基金项目和高等学校博士学科点专项科研基金的支持。该方法针对多声源混迭语音问题,特别关注在实际环境中的有效应用。 研究的核心步骤包括以下几个部分: 1. **空间特征提取与模型构建**:首先,将水平面划分为多个相等的扇形区域,目的是利用等边三角形麦克风阵列的优势,提取每个区域的独特空间特性。通过这些空间特征,构建精确的空间方位模型,这一步对于后续声源定位至关重要。 2. **声源检测与方位估计**:在录音过程中,将输入音频数据分割成多个相等长度的数据段,通过对每个数据段进行分析,估计算法能够识别出的声源数量及其相对方位。这一步采用了盲源分离技术,即使在没有先验信息的情况下也能进行声源分离。 3. **模型适应与时频掩模估计**:针对每个声源,选取与其方位角最接近的预建模型进行适应,从而获得更精确的空间方位模型。这些模型用于生成二元时频掩膜,这是一种重要的信号处理手段,能够有效地抑制其他声源的干扰。 4. **声源分离与合并**:在每个数据块中,独立进行声源分离操作,然后将来自同一扇形区域的音频数据合并到一起,形成最终的音频流。这种方法保证了分离结果的准确性,同时减少了数据处理的复杂性。 5. **实验验证与性能评估**:通过在真实的会议室环境中进行实验,证明了该方法在实际应用中的有效性。结果显示,该声源分离方法能有效地分离各个语音信号,且语音失真较低,性能接近于非盲条件下(即有先验信息)的分离效果。 关键词:“欠定盲源分离”、“波达方向估计”、“时频掩膜”和“等边三角形麦克风阵列”揭示了文章的主要技术焦点,表明了研究者在解决多声道语音处理问题上的创新尝试。 这篇论文提供了一种实用的声源分离算法,结合了等边三角形麦克风阵列的特性和现代盲源分离技术,有望在实际音频处理系统中得到广泛应用。