协同过滤推荐系统相似性度量:深度分析与实验对比

0 下载量 8 浏览量 更新于2024-06-17 收藏 3.08MB PDF 举报
"沙特国王大学学报的一篇文章深入探讨了协同过滤推荐系统中相似性度量的综述和实验比较,由Fethi Fkih在MARS研究实验室进行研究。文章关注的重点在于如何利用不同的相似性度量来优化推荐系统的性能,特别强调了在基于用户和基于项目的协同过滤方法中的应用。实验对比了多种相似性度量在MovieLens100k、MovieLens1M和Jester数据集上的表现,结果显示ITR和IPWR对于基于用户的推荐系统最有效,而AMI则是基于项目的推荐系统的最佳选择。" 本文主要讨论了协同过滤(Collaborative Filtering, CF)推荐系统的核心概念和相似性度量的重要性。协同过滤是一种广泛应用于个性化推荐的技术,它依赖于用户的历史行为和偏好来预测他们可能感兴趣的新物品。推荐系统根据用户与其他用户的相似性构建目标用户的配置文件,因此选择合适的相似性度量对于准确预测用户喜好至关重要。 在基于用户的协同过滤(UBCF)中,度量用户之间的相似性通常是预测未知评分的关键。文章提到的邻居选择和评分预测是UBCF的两个关键步骤。邻居选择涉及确定与目标用户最相似的其他用户,而评分预测则使用这些相似用户的评分来预测目标用户对未评分项的可能评分。 另一方面,基于项目的协同过滤(IBCF)侧重于项目之间的相似性,同样包括邻居选择和评分预测。在这种情况下,项目之间的相似性用于预测用户对未评价项目可能的喜好。 文章详细回顾了多种相似性度量,如向量相似度(余弦相似度)和调整后的相似性度量,这些度量用于量化用户或项目之间的关系强度。实验结果表明,对于基于用户的推荐系统,Information Theoretic Reliability (ITR)和Item-to-User Predictive Ranking (IPWR)表现出色,而在基于项目的系统中,Adjusted Mutual Information (AMI)是最优的相似性度量。 具体实验数据显示,ITR在MovieLens100k和MovieLens1M上获得了最低的平均绝对误差(MAE),分别是0.786和0.731,而IPWR在Jester上的MAE为3.256。相应地,AMI在基于项目的方法中展现出色的性能,其MAE在三个数据集上分别为0.745、0.724和3.281。 选择正确的相似性度量对于提升协同过滤推荐系统的准确性具有显著影响。不同的数据集和推荐系统类型可能需要采用不同的度量方法,这需要进一步的研究和实验来优化推荐算法的性能。此外,这项工作也提醒研究人员在设计和评估推荐系统时应考虑多种相似性度量,并针对特定应用场景进行选择。