基于物品相似度与用户活跃度的单类协同过滤推荐优化

需积分: 9 0 下载量 34 浏览量 更新于2024-08-13 收藏 405KB PDF 举报
"改进的单类协同过滤推荐方法* (2014年),王鹏,景丽萍,北京交通大学交通数据分析与挖掘北京市重点实验室" 在推荐系统领域,协同过滤是一种广泛应用的技术,它依赖于用户的历史行为来预测他们可能对未评价物品的兴趣。然而,传统的协同过滤方法(包括单类协同过滤)面临着数据稀疏性和负样本缺乏的问题。单类协同过滤主要用于处理只有正反馈(如用户对物品的喜欢或购买)而无负反馈(如用户对物品的不喜欢)的数据集。在这种情况下,模型很难学习到有效的用户兴趣模式。 王鹏和景丽萍在2014年提出了一种改进的单类协同过滤推荐方法,旨在解决上述挑战。他们引入了一种正负样本选择算法,该算法结合了物品相似度和用户活跃度两个关键因素。在处理数据稀疏性问题时,他们通过物品相似度添加了正样本,这意味着将与用户已评价的物品相似的其他物品视为潜在的正样本,这样可以丰富模型学习的特征空间,帮助捕捉用户的潜在兴趣。 同时,针对负样本的缺乏,他们依据用户活跃度动态地为每个用户添加不同数量的负样本。活跃度高的用户可能会有更多未评价的物品,因此添加更多的负样本有助于更准确地刻画他们的兴趣边界。相反,对于活跃度较低的用户,添加适量的负样本可以防止过拟合,保持模型的泛化能力。 在实现这一方法时,研究人员采用了矩阵分解技术,这是一种常见的协同过滤实现方式,通过将用户-物品交互矩阵分解为用户和物品的低维表示,进而预测用户对未知物品的评分。通过正负样本的优化,矩阵分解过程中的特征提取更加明确,训练结果的区分度也得以提升,从而提高了推荐的准确性和覆盖率。 实验结果证明,该改进策略有效地减少了稀疏性对推荐效果的影响,并且在正负样本的选择上提高了精度。这表明,结合物品相似度和用户活跃度的正负样本选择策略能显著提升单类协同过滤推荐系统的性能,为实际应用中的推荐问题提供了一种有效解决方案。 这项工作展示了如何通过创新的样本选择策略改善单类协同过滤方法,特别是在处理数据稀疏性和负样本不足的情况下。这种方法不仅对推荐系统的设计有所启示,也为未来在类似问题上的研究提供了理论基础和技术参考。