本体与EM聚类结合的协同过滤推荐系统研究

需积分: 0 3 下载量 86 浏览量 更新于2024-09-08 收藏 620KB PDF 举报
"基于本体和EM聚类的协同过滤推荐系统研究,旨在解决电子商务中用户-项目评级矩阵稀疏导致的推荐系统准确性问题。通过结合本体和EM聚类算法,提升协同过滤推荐的性能。" 这篇论文研究的是在推荐系统领域的创新方法,特别是针对协同过滤(Collaborative Filtering, CF)技术在处理大量用户和商品数据时遇到的挑战。在电子商务环境中,由于用户对项目的评价数据通常很稀疏,这会降低推荐系统的准确性。为了改善这一状况,作者刘伟成和李权提出了一个基于本体(Ontology)和期望最大化(Expectation Maximization, EM)聚类的协同过滤推荐系统。 首先,论文采用EM算法对用户-项目评级矩阵进行聚类分析。EM算法是一种统计学习中的迭代算法,能处理缺失数据,用于估计混合模型的参数。在这里,它被用来将用户和项目分成不同的群组,以挖掘隐藏的结构和模式。 接着,利用领域本体来计算项目之间的语义相似度。本体是形式化描述领域知识的一种方式,可以捕捉概念、属性和关系,有助于理解和关联不同项目。通过比较项目在本体中的相似性,可以补充评级矩阵中的稀疏信息,提高推荐的精确性。 随后,论文应用奇异值分解(Singular Value Decomposition, SVD)对用户群集和项目群集进行降维处理,找到每个项目和用户群集中最相似的项目和用户。SVD是一种矩阵分解技术,常用于推荐系统中发现潜在的用户和项目特征。 最后,结合项目的语义相似度和基于矩阵分解的用户、项目相似性,推荐系统生成最终的推荐列表。这种融合策略旨在同时利用结构化(通过EM聚类和SVD)和非结构化(通过本体)的信息,提高推荐的准确性和覆盖率。 实验部分,该方法在MovieLens数据集上进行了验证,并与传统推荐方法进行了对比。结果显示,所提出的推荐系统有效地缓解了协同过滤推荐的稀疏性问题,并提升了推荐的准确性。 关键词:推荐系统、本体、EM聚类、降维、稀疏性 这篇研究对于理解和改进推荐系统有重要的理论价值和实践意义,特别是在处理大数据稀疏性问题时,提供了新的思路和解决方案。