结构化稀疏分解与压缩感知实现音频信号有损压缩

0 下载量 119 浏览量 更新于2024-08-27 收藏 226KB PDF 举报
"本文提出了一种利用结构化稀疏分解和压缩感知技术进行有损音频信号压缩的方法。通过使用LASSO(最小绝对收缩选择算子)将音频信号分解为音调层和瞬态层,并对这两层分别采用压缩感知方法进行压缩。引入新的惩罚项,利用变换系数的结构信息,LASSO可以实现比传统方法更好的音频信号稀疏逼近。此外,还提出了一个稀疏性分配算法,动态调整两个结果层之间的稀疏度,从而提升压缩感知的性能。实验结果显示,新方法的压缩性能优于传统方法。" 在本文中,作者探讨了一个创新的音频压缩技术,它结合了结构化稀疏分解和压缩感知的概念。这项技术的目标是实现有损音频信号的高效压缩,以减小存储空间和传输带宽的需求。 首先,他们采用LASSO进行信号分解。LASSO是一种线性模型选择和变量选择的方法,它通过最小化残差平方和的同时,对系数施加一个L1范数惩罚,促使模型系数向量具有稀疏性。在音频信号处理中,LASSO被用来将音频信号分解为两个主要成分:音调层(代表持续且稳定的音调部分)和瞬态层(代表短暂的、非平稳的声音事件)。这种分解有助于区分音频的不同特性,以便于后续处理。 接下来,引入压缩感知理论。压缩感知是一种理论,允许以远低于奈奎斯特定理所要求的速率对信号进行采样,仍能重构信号。在这个过程中,两个分解出的层都通过压缩感知算法进行压缩,以减少数据量,同时保持可接受的信号质量。 为了进一步优化压缩效果,作者设计了一个新的惩罚项,该惩罚项考虑了变换系数的结构信息。这使得LASSO能够更准确地捕捉音频信号的内在结构,从而得到更好的稀疏近似。 此外,他们还提出了一种稀疏性分配算法。这个算法动态调整音调层和瞬态层之间的稀疏程度,以适应不同类型的音频内容。通过对不同层的稀疏度进行优化,可以提高压缩感知的效率和压缩后的信号质量。 实验结果证实了这种方法的有效性,显示新方法在保持音质的同时,提供了优于传统音频压缩技术的压缩性能。这表明,结合结构化稀疏分解和压缩感知的新方法对于音频信号压缩领域是一个重要的进步,有可能被广泛应用于音频编码、存储和传输等领域。