项目候选集协同过滤算法:缓解数据稀疏性问题

需积分: 8 0 下载量 173 浏览量 更新于2024-08-12 收藏 931KB PDF 举报
"基于项目候选集的协同过滤算法 (2016年) 是一篇由曾安、谢杰民和潘丹等人撰写的论文,主要探讨了如何缓解传统协同过滤算法在处理数据稀疏性问题上的局限性。这篇论文受到国家自然科学基金、广东省自然科学基金和广州市科技计划项目的资助。研究团队通过引入用户之间的非对称影响度和支持度,提出了一个基于项目候选集的协同过滤推荐算法,旨在提高推荐系统的准确性和推荐质量。" 这篇论文详细介绍了协同过滤推荐系统中的核心概念和技术。协同过滤是一种广泛使用的个性化推荐方法,它基于用户的历史行为来预测他们可能感兴趣的物品。然而,传统的协同过滤算法往往面临数据稀疏性的挑战,即用户对物品的评分数据有限,这可能导致算法的推荐效果不佳。 论文中提出的新算法通过以下步骤来改善这一情况: 1. 非对称影响度和支持度:在计算用户之间的相似性时,论文考虑了用户之间的非对称性,即一个用户对另一个用户的影响可能不同于后者对前者的影响力。这种非对称性有助于更准确地反映用户间的相互影响。 2. 项目候选集:基于用户之间的相似性和非对称性,算法构建了一个项目候选集,包含可能对用户有吸引力的物品。这种方法减少了计算复杂性,同时增加了推荐的多样性。 3. 项目信息熵:论文进一步利用项目的信息熵来修正未评分项目集合,以优化候选项目集合。信息熵是一个衡量信息不确定性的度量,用于识别那些具有更高信息价值的项目,从而提高推荐的准确性和覆盖率。 4. 实验与比较:为了验证算法的有效性,研究者在MovieLens和Netflix数据集上进行了实验。结果显示,提出的算法在推荐准确率、召回率和F1值上均优于其他流行算法,有效地减少了数据稀疏性对推荐性能的负面影响,提升了推荐系统的整体质量。 这篇论文为解决协同过滤中的数据稀疏性问题提供了一个创新的解决方案,通过引入非对称性、项目候选集和信息熵等概念,提高了推荐算法的准确性和实用性,对于推荐系统的设计和优化具有重要的理论和实践意义。