受限非负矩阵分解:提升信息检索精度的新方法

需积分: 10 7 下载量 119 浏览量 更新于2024-10-30 收藏 113KB PDF 举报
"该资源是一篇发表在2004年3月《东南大学学报(自然科学版)》上的学术论文,由黄钢石、张亚非、陆建江和徐宝文共同撰写。论文主要介绍了受限非负矩阵分解(Constrained Non-negative Matrix Factorization, CNMF)作为一种新的信息检索技术,用于获取更正交的潜在语义,并且在实验中显示了比传统非负矩阵分解(Non-negative Matrix Factorization, NMF)更高的检索精度。" 在信息处理和数据分析领域,非负矩阵分解(NMF)是一种常用的技术,它通过将非负的输入矩阵分解为两个非负的低秩矩阵,从而揭示数据的隐藏结构和潜在语义。然而,原始的NMF方法往往无法保证分解出的因子矩阵之间的正交性,这可能影响到对数据理解的准确性。为了解决这个问题,研究者们提出了受限非负矩阵分解(CNMF)。 CNMF在NMF的基础上引入了额外的约束条件,这些约束条件用于改进分解过程,使得分解得到的矩阵在一定程度上更加正交。正交性的增强有助于减少不同特征间的冗余,提高数据表示的独立性和解析效果。论文中详细描述了如何定义CNMF的目标函数,这个目标函数在NMF的目标函数基础上增加了三个约束条件,这些条件有助于优化分解过程。 论文还提出了求解CNMF目标函数的迭代规则,并证明了这些迭代规则的收敛性。这意味着,通过一系列迭代操作,算法可以稳定地接近最优解,从而得到理想的分解结果。这一过程是关键,因为它确保了算法的稳定性与可行性。 实验部分对比了CNMF与NMF在信息检索任务中的性能。结果显示,受限非负矩阵分解在信息检索的精度上优于传统的非负矩阵分解,这表明CNMF在提取语义特征和提升检索效果方面具有优势,特别是在处理大量文本数据或高维信息时。 这篇论文提供了一种改进的矩阵分解方法,即CNMF,它在保持非负性的基础上,通过引入约束提高了潜在语义的正交性,这对于信息检索和其他依赖数据解析的应用领域具有重要的理论和实践价值。