听觉外围模型在音频基频估计中的应用

需积分: 9 0 下载量 46 浏览量 更新于2024-09-05 收藏 514KB PDF 举报
"这篇论文研究了一种基于听觉外围模型的音频基频估计方法,旨在提高在有打击乐干扰情况下的基频检测准确性。通过模拟声音在人耳内的传导过程,利用循环平均幅度差函数(Cyclic AMDF)来判断时域周期性,从而提取音频信号的基频。实验证明,这种方法在纯净音频条件和打击乐干扰下均表现出高精度,且错误率低于其他参考方法。" 音频信号的基频是声音周期性特征的重要指标,它在语音识别、音频压缩、音乐分析等多个领域起到关键作用。传统的基频估计方法包括时域、频域和时频联合估计法。时域估计法因其高效性而常用,例如AMDF和ACF法,它们在一定程度上能提供准确且鲁棒的基频估计。然而,这些方法在噪声或打击乐等暂态成分存在时,其性能会受到影响。 为了应对这个问题,本文提出的听觉外围模型基频估计方法借鉴了人耳对声音处理的生理机制。人耳在接收声音时,会将声波转化为神经信号,这个过程可以抽象为一个听觉外围模型。通过模拟这一过程,该方法可以更精确地识别出音频信号中的周期性模式,从而降低暂态成分对基频估计的干扰。 循环平均幅度差函数(Cyclic AMDF)是该方法的核心技术,它在传统AMDF的基础上增加了对周期性的循环分析,能够更有效地识别音频信号中的基频。实验结果显示,这种方法在纯净音频条件下能准确估计基频,并在打击乐干扰下,其平均错误率显著低于现有的几种主流方法,如YIN方法、加权ACF等。 此外,对于打击乐伴奏中的暂态成分,该方法通过听觉模型的处理,能更好地分离出音调性器乐信号,避免了这些噪声对基频估计的负面影响。这种方法的出现,为音频处理领域提供了一个新的思路,特别是在有噪声和复杂音频环境中的基频估计问题,具有很高的实用价值和研究意义。