改进协同过滤的时权算法:提高预测精度与效率

需积分: 30 3 下载量 49 浏览量 更新于2024-08-06 1 收藏 1.97MB PDF 举报
本文主要探讨了一种针对传统协同过滤算法在数据稀疏性、可扩展性和用户兴趣度偏差等问题的改进方法。在当前的互联网推荐系统中,协同过滤是一种广泛应用的个性化推荐策略,但由于其依赖于用户的历史行为数据,当数据变得稀疏时,算法的预测性能往往会受到影响。为此,研究者提出了一种结合时间权重的Mini batch K-Means算法来优化协同过滤。 改进的协同过滤算法首先通过Pearson相关系数来增强MiBatch K-Means聚类过程,这种方法可以更有效地处理稀疏评分矩阵,通过对用户的评分行为进行聚类,计算出用户对不同项目的兴趣程度,并填充到原本数据稀疏的区域。这样,算法能够更好地理解和捕捉用户的动态兴趣变化。 进一步地,为了考虑用户兴趣随时间的演变,引入了牛顿冷却时间权重,这是一种模拟热力学现象的数学模型,用于计算用户对不同项目的相似度。这个权重机制帮助算法适应用户兴趣的时效性,使得近期的行为对推荐结果的影响更大,从而提高预测精度。 在填充后的评分矩阵基础上,算法采用相似度加权计算,给出每个项目最终的评分。实验结果显示,这种改进的时间权重推荐算法相比于传统的协同过滤算法,显著降低了平均绝对误差,提升了准确率、召回率和F值,显示出更高的评分预测精确度和准确度。 该研究对于提升推荐系统的性能具有重要意义,特别是在大数据环境下,通过结合时间因素和优化的聚类方法,能够在一定程度上解决数据稀疏性问题,为用户提供更精准、更具实时性的个性化推荐体验。此外,研究也为其他领域,如电子商务、社交网络和在线广告等领域中的推荐系统提供了新的改进思路。