Bregman散度下的非负矩阵分解扩展

需积分: 9 4 下载量 170 浏览量 更新于2024-09-27 收藏 149KB PDF 举报
"这篇文档是Inderjit S. Dhillon和Suvrit Sra于2005年发表的UTCSTechnical Report,标题为'Generalized Nonnegative Matrix Approximations with Bregman Divergences',探讨了如何使用Bregman散度进行非负矩阵分解(NMF)的扩展。" 非负矩阵分解(Non-negative Matrix Factorization, NMF)是一种用于数据降维和分析的技术,它可以将非负输入数据转化为稀疏且非负的组成部分表示。这种方法在文本分析、文档聚类、人脸识别、语言建模、语音处理等多个领域都有广泛的应用。然而,尽管NMF有诸多应用场景,但其计算因子的算法开发相对滞后。 本文档主要贡献在于提出了一个新的通用化NMF问题模型,该模型利用Bregman散度最小化输入矩阵与其低秩近似之间的差距。Bregman散度是一种衡量两个概率分布或向量之间差异的度量,它比传统的欧几里得距离更为灵活,可以适应不同的优化目标和数据特性。 在Dhillon和Sra的工作中,他们使用乘法更新公式来求解这些新提出的广义NMF问题。这些乘法更新规则是之前由Lee和Seung在他们的开创性工作中提出的一种特殊情况。通过Bregman散度,算法可以更好地捕捉数据的结构,尤其是当数据具有特定的非负属性时,如在文本数据中词频的非负性。 作者不仅提出了新的优化框架,还可能讨论了算法的收敛性和效率。他们可能还提供了实验结果,以证明新方法在实际应用中的性能和优势,以及与传统NMF方法相比的改进之处。这篇报告对理解和应用基于Bregman散度的NMF提供了深入的理论和实践指导,对于想要在NMF领域进行深入研究或者解决特定问题的研究者和工程师来说,是非常有价值的资源。