个性化推荐系统:解决数据稀疏与冷启动问题

需积分: 32 30 下载量 28 浏览量 更新于2024-08-09 收藏 3.27MB PDF 举报
"本文主要探讨了在个性化推荐系统中,尤其是针对协同过滤系统所面临的稀疏性和冷启动问题的研究。文章作者孙小华在博士论文中提出了一种在数据稀疏和冷启动状况下提高预测准确性的策略。研究背景是北京人大金仓信息技术有限公司的Kingbase DL系统,该系统运用用户兴趣建模和个性化推荐,但面临用户数据不足和新资源、新用户引入时的挑战。 协同过滤是一种常见的推荐系统方法,它可以预测用户对项目的喜好以提供个性化推荐,但存在精度、数据稀疏和冷启动等难题。在无法获取项目内容信息和用户个人信息的情况下,论文提出的新方法旨在改善这些问题。作者试验了两种技术:一种是特征递增型的PearAfter_SVD,它结合了奇异值分解和基于邻居的Pearson算法;另一种是转换型的LCMSTI,它动态切换于潜在分类模型的Pearson算法和STIN算法之间,根据数据状态调整推荐策略。实验证明,这两种方法在处理数据稀疏时表现优秀。 对于冷启动问题,论文提出了基于统计的众数法和信息熵法。前者利用用户评分的众数来预测新用户或新项目评分,后者则运用信息熵来选择有意义的用户群体进行推荐。这两种方法在解决新用户和新项目进入时的预测准确性方面有所贡献。 这篇博士论文为协同过滤系统在实际应用中的优化提供了有价值的理论和实践依据,特别是在处理大规模数字资源推荐时,如何克服数据稀疏性和冷启动问题,从而提高推荐的准确性和用户体验。"