受限非负矩阵分解方法:提升信息检索精度

需积分: 9 0 下载量 153 浏览量 更新于2024-08-11 收藏 176KB PDF 举报
"该资源是一篇发表在2004年3月《东南大学学报(自然科学版)》第34卷第2期的学术论文,由黄钢石、张亚非、陆建江和徐宝文合作撰写。文章主要讨论了一种新的数学方法——受限非负矩阵分解(Constrained Non-negative Matrix Factorization, CNMF),用于信息检索中的潜在语义分析。CNMF是基于非负矩阵分解(Non-negative Matrix Factorization, NMF)的一种改进技术,增加了三个约束条件以提高分解结果的正交性,进而提升信息检索的精度。" 在本文中,作者提出了一种新的矩阵分解方法,即受限非负矩阵分解。传统的非负矩阵分解是一种将非负矩阵W分解为两个非负矩阵H和V的乘积,即W=HV,常用于数据挖掘、图像处理和文本分析等领域。然而,这种方法通常不能保证分解后的矩阵组件之间具有良好的正交性,这可能影响到对潜在语义的准确捕捉。 为了改善这一情况,作者引入了三个额外的约束条件来定义受限非负矩阵分解的目标函数。这些约束条件旨在优化分解过程,使得分解出的矩阵组件更加正交,从而增强潜在语义表示的独立性和可解释性。他们还提出了一套迭代规则来求解这个新目标函数,并证明了这一规则的收敛性,即随着迭代次数的增加,算法会逐步接近最优解。 实验部分展示了受限非负矩阵分解在信息检索任务上的优越性能。与非负矩阵分解相比,CNMF能够更好地揭示文档和查询之间的潜在语义关联,从而提高信息检索的精确度。这对于信息检索系统的设计和优化具有重要意义,因为它能够提供更准确的搜索结果,提升用户体验。 关键词涵盖了非负矩阵分解的基础概念,受限非负矩阵分解作为其扩展,以及它们在信息检索中的应用。文章的分类号和文献标识码表明这是一篇自然科学领域的研究论文,对计算机科学,特别是数据挖掘和信息检索领域的研究人员具有参考价值。 这篇论文为非负矩阵分解提供了一个改进的框架,通过引入约束条件提高了潜在语义的正交性,对于理解和利用高维数据的内在结构有着积极的贡献。这种技术的应用不仅限于信息检索,还可以推广到其他需要理解复杂数据模式的领域,如生物信息学、推荐系统和社交媒体分析等。