基于基频与帧间相关性的高效单通道语音分离法

1 下载量 81 浏览量 更新于2024-08-29 收藏 403KB PDF 举报
本文探讨了一种创新的单通道语音分离算法,主要依据声音的基频状态和帧间相关性。该方法由东南大学信息科学与工程学院和南京农业大学工学院的研究团队提出,发表于2014年11月的《东南大学学报(自然科学版)》第44卷第6期。研究者们针对混合语音信号,首先通过提取两个源语音的基频进行状态编码,这一步骤有助于构建一个自适应字典,利用基频信息对不同的语音信号进行区分。 接着,作者采用频繁模式挖掘算法,这是一种数据挖掘技术,用于识别在基频状态为1时出现频率较高的子集,从而有效地减少字典的复杂度,提高算法的效率。这种方法有助于在处理大量数据时找到关键特征,显著降低了计算负担。 后续,该算法以正交匹配追踪(Orthogonal Matching Pursuit,OMP)为基础,对混合语音帧进行初步分离。然而,对于分离效果不理想的部分,算法会搜索与之相关的平移后邻近帧,并进行叠加,通过软掩蔽技术进行二次校正。这种策略能够进一步提升分离质量,确保语音信号的纯净度。 实验结果显示,相较于现有的两种经典语音分离算法,这种基于基频状态和帧间相关性的算法在分离语音信噪比上表现出明显优势。此外,频繁模式挖掘算法的应用不仅提高了分离效果,还大幅度减少了算法的运行时间,显示出了良好的性能和实用性。 文章的关键点包括语音分离、稀疏分解、正交匹配追踪、基频分析以及数据挖掘技术在音频处理中的应用。整个研究具有重要的理论价值和实际意义,对于单通道语音处理任务的优化有着积极的推动作用。