基于听觉掩蔽效应的语音音质改进评估方法

需积分: 10 0 下载量 116 浏览量 更新于2024-08-21 收藏 658KB PDF 举报
"一种改进的客观音质评价方法 (2004年),描述了一种利用人耳听觉掩蔽效应改进巴克谱失真距离测度的方法,以提高音质评价的相关性。" 该论文主要探讨了在语音质量和通信系统评估中的一个重要问题,即如何改进客观音质评价方法,使其更接近于人的主观感受。传统的主观评价方法,如平均意见分(MOS),虽然准确反映人类对语音质量的感觉,但操作繁琐且易受主观因素影响。相比之下,客观评价方法通过计算失真距离来评估语音质量,速度快但未能充分考虑影响主观评价的复杂因素。 论文提出了一种创新的策略,即利用人耳的听觉掩蔽效应来动态调整语音信号每个巴克带的掩蔽门限。这种方法有选择性地计算失真,仅关注人耳能察觉的失真部分,从而提高了客观评价与主观评价之间的相关性。具体来说,研究者可能采用了类似于频域分析的技术,结合听觉模型,对不同频率成分的失真进行了加权处理。 在实验阶段,这种改进的测度被应用于特定失真语音条件下,实验结果表明主客观评价的相关系数显著提高。这表明改进后的客观评价方法具有更好的效度和实用性,可作为语音系统质量评估的有力工具。此外,论文可能还涉及了多项式拟合关系,这是一种将客观评价与主观评价关联起来的统计模型,用于预测主观评分。 这项工作为语音编码和通信系统的质量评估提供了新的思路,通过更精确地模拟人类听觉系统的行为,提升了客观评价的准确性。这一研究对于语音处理、通信技术以及相关领域的工程师和研究人员具有重要的参考价值,有助于开发出更高效、更贴近人耳感知的语音压缩和传输技术。