提升推荐精度:模糊聚类与改进混合蛙跳算法在协同过滤中的应用

需积分: 15 0 下载量 119 浏览量 更新于2024-09-07 1 收藏 1022KB PDF 举报
"这篇论文提出了一种改进的协同过滤推荐算法,通过结合模糊聚类和改进的混合蛙跳算法来解决传统协同过滤方法中的数据稀疏性、冷启动和推荐精度低的问题。" 在协同过滤推荐领域,数据稀疏性和冷启动是两个常见的挑战。数据稀疏性指的是在用户-项目评分矩阵中,由于用户的评价数据有限,导致大量的空白(未知评分),这会影响推荐系统的准确性。而冷启动问题则发生在新用户或新项目加入系统时,由于缺乏历史交互数据,难以生成有效的推荐。 为了解决这些问题,该论文提出了一种新的方法。首先,引入了基于时间的指数遗忘函数来处理原始评分数据。这个函数能够随着时间的推移逐步降低旧评分的影响,使得系统更加关注用户的近期偏好,从而减轻数据稀疏性的影响。 接下来,论文应用模糊C-均值(FCM)聚类算法对用户进行聚类。FCM聚类允许数据点同时属于多个类别,这有助于捕捉用户兴趣的多维度和模糊性。通过对用户进行聚类,并选择与目标用户有高相似性的类作为候选邻居集,可以更好地发现潜在的相似用户,即使他们的评分数据非常有限。 然后,论文采用了改进的混合蛙跳算法来寻找最近的邻居集。混合蛙跳算法是一种优化算法,源于自然界中蛙类的跳跃行为,用于全局搜索最优解。通过改进,它能在复杂的数据空间中更有效地寻找最接近的邻居,进一步提高推荐精度。 最后,基于找到的最近邻集,论文计算目标用户对未参与项目的预测评分,生成推荐列表。通过实验验证,这种方法相比于其他算法,推荐精度更高,而且对于数据稀疏性的缓解效果显著。 该研究得到了河北省自然科学基金、河北省科技计划和天津市自然科学基金的支持,由许智宏、田雨、闫文杰和暴利花等研究人员共同完成。他们的工作集中在分布式计算、智能信息处理、数据挖掘等领域,为协同过滤推荐算法的改进提供了理论和实践基础。