个性化搜索引擎新排序算法:基于SVD和k-means的用户兴趣模型

需积分: 9 0 下载量 3 浏览量 更新于2024-08-12 收藏 402KB PDF 举报
"一个新的个性化搜索引擎排序算法 (2013年)" 是一篇自然科学领域的论文,主要探讨了如何改进个性化搜索引擎的排序算法以提供更精确的个性化搜索结果。 在这篇论文中,作者肖瑜和赵俊忠针对现有搜索引擎的局限性,提出了一种新的排序策略。传统的搜索引擎通常按照关键词匹配度来排序搜索结果,但在海量信息中,这往往无法满足用户快速找到感兴趣内容的需求。个性化搜索则旨在理解用户的兴趣,以便优先展示用户可能更关心的网页。 新算法的核心在于利用Singular Value Decomposition(奇异值分解,SVD)和k-means聚类技术。SVD是一种矩阵分解方法,常用于降维和特征提取,在此应用场景中,它用于分析用户浏览历史中的文档,将文档在不同粒度上进行聚类。k-means聚类则用于将词聚类,这两步操作构建了文档类树和词类树,树上的节点权值反映了用户对特定类别文档或词汇的兴趣程度。 接下来,论文中提到了应用Naive Bayes Classifier(朴素贝叶斯分类器)对搜索引擎获取的网页进行文档分类和词分类。朴素贝叶斯是一种基于概率的分类方法,它假设各特征之间相互独立,通过计算先验概率和后验概率来进行预测。在此,分类器会根据用户的兴趣模型对网页进行评分。 最后,根据文档的评分,搜索引擎将搜索结果按降序排列,从而实现个性化排序。实验结果显示,这种方法能更准确地定位用户感兴趣的信息,提高了用户体验。 这篇论文的关键词包括个性化排序、用户兴趣模型、奇异值分解、k-means聚类算法以及朴素贝叶斯分类器,这些概念都是搜索引擎优化和信息检索领域的关键工具和技术。通过结合这些技术,论文提出的排序算法为解决传统搜索引擎的问题提供了新的思路,展示了个性化搜索在提升信息检索效率方面的潜力。