协同过滤系统:稀疏性与冷启动问题解决方案

需积分: 32 30 下载量 144 浏览量 更新于2024-08-09 收藏 3.27MB PDF 举报
"这篇博士学位论文主要探讨了协同过滤系统在推荐系统中的应用,尤其是在面对数据稀疏性和冷启动问题时的挑战。作者孙小华在计算机科学与技术领域,由孔繁胜教授指导,研究了如何在缺乏项目内容信息和用户个人信息的情况下,提升协同过滤预测的准确性。文中提出了两种策略,即PearAfter_SVD方法和LCMSTI方法,以应对数据稀疏性。同时,还探讨了解决冷启动问题的众数法和信息熵法。" 协同过滤系统是一种广泛使用的推荐系统技术,其核心是根据用户历史评分行为,找出具有相似兴趣的用户,然后基于这些相似用户的评分预测目标用户对未评价项目的偏好。在实际应用中,协同过滤面临的主要问题是数据稀疏性和冷启动问题。 数据稀疏性是指在大规模用户和项目空间中,用户对项目的评分往往是不完全的,导致评分矩阵极度稀疏。论文中,PearAfter_SVD和LCMSTI方法被提出来改善这一问题。PearAfter_SVD首先运用奇异值分解(SVD)对评分矩阵进行降维处理,以减少数据稀疏性的影响,然后采用基于用户相似度的Pearson算法进行预测。LCMSTI方法则是动态切换不同推荐策略,依据当前系统状态在不同协同过滤方法之间转换,以适应数据稀疏情况。 冷启动问题分为新用户问题和新项目问题。新用户没有足够的评分历史,新项目没有用户评分。论文提出基于统计的众数法和信息熵法来解决。众数法假设用户会跟随大众的偏好,用所有用户对某一项目评分的众数作为新用户对该项目评分的预测。信息熵法则利用信息理论,通过计算评分分布的不确定性来选取最具代表性的项目或用户,为冷启动用户提供评分预测。 这篇论文深入研究了协同过滤在数据稀疏和冷启动条件下的优化策略,旨在提高推荐系统的预测精度和实用性,特别是在缺乏额外信息的场景下。通过实验验证,所提出的解决方案在应对数据稀疏性和冷启动问题上展现出优越性能。