连续丢包隐藏技术:基于SELP声码器的解决方案

需积分: 10 3 下载量 31 浏览量 更新于2024-08-11 收藏 283KB PDF 举报
"基于SELP声码器的连续丢包隐藏算法 (2010年),由计哲、徐敬德、崔慧娟和唐昆在清华大学电子工程系发表,研究了如何在连续丢包情况下提高声码器合成语音的质量。" 在VoIP(Voice over Internet Protocol)通信中,网络丢包是常见的问题,它严重影响了语音通信的清晰度和用户体验。SELP(Spectral Envelop and LP Residual)声码器是一种常用的语音编码技术,它通过分析语音信号的频谱包络和线性预测残差来压缩语音数据。然而,当网络连续丢包发生时,传统的抗丢包处理算法往往无法有效地恢复语音质量。 论文提出的是一种特征参数的分模式线性预测技术。这种方法针对的是声码器参数的短时相关性,即在短时间内,相邻语音帧的参数之间存在一定的关联性。研究者将子带清浊音参数作为模式信息,这是因为清音和浊音在语音信号中的特性显著,可以作为区分不同模式的基础。 在连续丢包的情况下,该算法首先计算每个特征参数在不同模式下的预测系数。这些系数是基于之前正确接收到的语音帧的参数来确定的,因为这些帧提供了关于接下来可能出现的参数变化的线索。一旦获得了分模式预测系数,就可以使用上一帧的特征参数来预测当前丢失帧的参数。这样,即使在网络丢包时,也能根据预测参数对丢失的语音帧进行重建。 实验结果显示,在丢包长度范围为75到200毫秒时,与传统抗丢包算法相比,采用该方法能将合成语音的平均意见得分(MOS)提升约0.03。MOS是一种广泛使用的主观评价标准,分数越高代表语音质量越好。因此,这种分模式线性预测技术对于改善连续丢包情况下的语音通信质量具有显著的效果。 总结来说,这篇论文提出了一个创新的解决策略,通过利用声码器参数的短期相关性和子带清浊音信息,设计出一种能够有效隐藏连续丢包影响的算法。这一成果对于优化网络语音传输的性能,尤其是在不可靠网络环境下,具有重要的实际应用价值。