临界频带与能量熵结合的语音端点检测算法

需积分: 9 1 下载量 4 浏览量 更新于2024-08-11 1 收藏 337KB PDF 举报
"基于临界频带及能量熵的语音端点检测 (2013年),张婷,何凌,黄华,刘肖珩" 本文主要探讨了一种创新的语音端点检测算法,该算法结合了临界频带理论和能量熵的概念,旨在提高在各种背景噪声环境下的语音检测准确率。语音端点检测是语音处理技术中的关键步骤,直接影响到语音识别、合成和增强等应用的性能。 临界频带是模拟人耳听觉感知的一种方式,它将声音频谱划分为多个频带,每个频带对应人耳对不同频率敏感的程度。在本文提出的算法中,首先对含噪语音信号进行临界频带分析,这样可以更好地模拟人耳对声音的感知,从而更精确地捕捉到语音的存在。 接着,算法利用能量熵这一概念来区分语音段和噪声段。能量熵是衡量信号在一个频带内能量分布均匀性的指标,当语音存在时,其能量通常在各个频带上分布不均匀,而噪声则呈现出相对均匀的能量分布。通过比较不同频带内的能量熵值,算法能够识别出语音活动的开始和结束点,即语音端点。 实验结果显示,与传统的短时能量法相比,该算法在语音端点检测上的正确率平均提高了1.6个百分点,显示出其在处理复杂噪声环境下的优势。尤其是在低信噪比(SNR)条件下,该方法仍然能有效地检测到语音端点,这是传统方法难以做到的。 论文《基于临界频带及能量熵的语音端点检测》发表在《计算机应用》杂志2013年第一期,由四川大学的学者张婷、何凌、黄华和刘肖珩共同完成。文章通过理论分析和实验验证,详细阐述了算法的设计思路、实现过程以及性能评估,为后续的语音处理研究提供了新的视角和方法。 关键词包括:小波降噪、临界频带、能量熵、语音端点检测。该研究对理解人耳听觉机制在语音处理中的应用,以及开发更适应实际环境的语音技术具有重要意义,尤其对于提高语音识别系统的鲁棒性和准确性具有积极的推动作用。 中图分类号:TP391(信息技术、计算机科学);TN912.3(通信技术、电子技术)。文献标志码A,表示该论文属于应用基础研究,具有较高的学术价值。