基于NMF的音调导向唱歌声音分离新方法：突破音高检测瓶颈

152 浏览量更新于2024-08-26 1 收藏 1.79MB PDF 举报

本文主要探讨了在单声道音乐录音中，针对基于音调的唱歌声音分离技术所面临的瓶颈问题。现有的歌唱声音分离算法普遍依赖于唱歌音调检测，这一过程作为基础步骤，对于识别和分离歌唱声的谐波结构至关重要。然而，由于音高检测的准确性不高，这在很大程度上制约了整个分离过程的性能。为了解决这个问题，作者提出了一种创新的方法，即采用非负矩阵分解（Non-negative Matrix Factorization，NMF）作为核心工具。NMF是一种数据降维和特征提取技术，它特别适合处理音频信号中的复杂结构，因为它能够发现数据的非负隐含结构。首先，研究者设计了一种结合NMF的策略，该策略考虑到了不同时间频率分辨率下人声的分布规律。通过这种方法，算法能够更好地识别并剔除许多与人声无关的背景噪声和干扰，显著增强演唱声的清晰度，从而提高了音调检测的精度。这一步旨在消除音调检测过程中可能引入的不确定性，提高分离过程的可靠性。其次，第二种新方法进一步利用NMF对声谱图进行分解，将复杂的声谱结构拆分为不重叠且不可分割的部分。除了音高信息，这些部分还包含其他有用的音频特征，如节奏、和谐结构等，可以作为额外的线索来辅助区分人声和伴奏。这种多维度的分析有助于提升分离算法的全面性能。这两种基于NMF的方法被整合到基于音调推理的框架中，形成了一种更为强大的歌声分离系统。在MIR-1K公开数据集上进行了广泛的实验评估，结果证明了这两种方法的有效性和优越性，它们在总体上超越了当前最先进的歌声分离算法。总结来说，本文的主要贡献在于提出了一种新颖的解决方案，通过结合NMF和对人声特性深入理解，有效地解决了基于音调的唱歌声音分离中的关键挑战。这不仅提高了音调检测的准确度，还提升了整体的分离效果，为音乐信息检索领域的研究开辟了新的可能性。

weixin_38650379

粉丝: 4
资源: 901

基于NMF的音调导向唱歌声音分离新方法：突破音高检测瓶颈

lstm_note_transcriptor:使用LSTM估计流行歌曲的音高，节奏和笔录音符

NE5532调音电路

NE5532详细资料

用定时器产生不同频率的PWM波实现产生不同音调声音和驱动蜂鸣器播放声音的实验分析

让蜂鸣器发出不同音调（频率）的声音？

AT89c51单片机设计一个电子琴 利用所给键盘的12345678个按键 发出八个不同音调 要求按下的按键发声 松开延时一点时间停止 中间再按别的键则发另一音调的声音

基于51单片机简易电子琴音调

key finder音调下载

名词解释： 音色、音调、音强，音长，音节，音素。如何区别声音中的男声，女声，小孩声？

蜂鸣器占空比调节音调源码

最新资源

AT89c51单片机设计一个电子琴利用所给键盘的12345678个按键发出八个不同音调要求按下的按键发声松开延时一点时间停止中间再按别的键则发另一音调的声音

名词解释：音色、音调、音强，音长，音节，音素。如何区别声音中的男声，女声，小孩声？