协同过滤技术在推荐系统中的稀疏性和冷启动问题研究

需积分: 32 30 下载量 23 浏览量 更新于2024-08-09 收藏 3.27MB PDF 举报
"这篇博士学位论文探讨了协同过滤系统在应对数据稀疏性和冷启动问题时的挑战,并提出了一些有效的解决方案。研究者孙小华在计算机科学与技术领域,由孔繁胜教授指导,针对这些问题进行了深入研究。协同过滤是推荐系统中的关键方法,但其准确性、稀疏数据处理和新用户/新项目的初始推荐(即冷启动)是亟待解决的问题。论文介绍的策略旨在提高预测准确性,即使在缺乏项目内容信息和用户个人资料的情况下也能发挥作用。" 在应对数据稀疏性方面,论文提出了两种方法:PearAfter_SVD和LCMSTI。PearAfter_SVD算法结合了奇异值分解和基于邻居的Pearson算法,首先通过奇异值分解预测评分,然后选择邻居,最后利用Pearson相关性计算预测值。转换型的LCMSTI方法则动态地在不同推荐策略之间切换,根据预设阈值在基于潜在分类模型的Pearson算法和STINl算法间转换。这两种方法都在数据稀疏时表现出较高的预测准确性。 对于冷启动问题,论文提出了基于统计的众数法和信息熵法。基于统计的众数法利用用户评分的集中趋势来预测新用户或新项目的评分,而信息熵法通过衡量不确定性来选择合适的推荐策略,这两种方法都试图在缺乏历史数据的情况下给出合理的初始推荐。 实验结果证明了这些方法在提高预测准确性和解决冷启动问题上的有效性,尤其是在无法获取项目内容信息和用户个人信息的情况下。这些研究为协同过滤推荐系统提供了新的思路和改进手段,有助于提升用户体验并优化推荐质量。