基于物品相似度与用户活跃度的单类协同过滤推荐优化

需积分: 9 34 浏览量更新于2024-08-13 收藏 405KB PDF 举报

"改进的单类协同过滤推荐方法* (2014年)，王鹏，景丽萍，北京交通大学交通数据分析与挖掘北京市重点实验室" 在推荐系统领域，协同过滤是一种广泛应用的技术，它依赖于用户的历史行为来预测他们可能对未评价物品的兴趣。然而，传统的协同过滤方法（包括单类协同过滤）面临着数据稀疏性和负样本缺乏的问题。单类协同过滤主要用于处理只有正反馈（如用户对物品的喜欢或购买）而无负反馈（如用户对物品的不喜欢）的数据集。在这种情况下，模型很难学习到有效的用户兴趣模式。王鹏和景丽萍在2014年提出了一种改进的单类协同过滤推荐方法，旨在解决上述挑战。他们引入了一种正负样本选择算法，该算法结合了物品相似度和用户活跃度两个关键因素。在处理数据稀疏性问题时，他们通过物品相似度添加了正样本，这意味着将与用户已评价的物品相似的其他物品视为潜在的正样本，这样可以丰富模型学习的特征空间，帮助捕捉用户的潜在兴趣。同时，针对负样本的缺乏，他们依据用户活跃度动态地为每个用户添加不同数量的负样本。活跃度高的用户可能会有更多未评价的物品，因此添加更多的负样本有助于更准确地刻画他们的兴趣边界。相反，对于活跃度较低的用户，添加适量的负样本可以防止过拟合，保持模型的泛化能力。在实现这一方法时，研究人员采用了矩阵分解技术，这是一种常见的协同过滤实现方式，通过将用户-物品交互矩阵分解为用户和物品的低维表示，进而预测用户对未知物品的评分。通过正负样本的优化，矩阵分解过程中的特征提取更加明确，训练结果的区分度也得以提升，从而提高了推荐的准确性和覆盖率。实验结果证明，该改进策略有效地减少了稀疏性对推荐效果的影响，并且在正负样本的选择上提高了精度。这表明，结合物品相似度和用户活跃度的正负样本选择策略能显著提升单类协同过滤推荐系统的性能，为实际应用中的推荐问题提供了一种有效解决方案。这项工作展示了如何通过创新的样本选择策略改善单类协同过滤方法，特别是在处理数据稀疏性和负样本不足的情况下。这种方法不仅对推荐系统的设计有所启示，也为未来在类似问题上的研究提供了理论基础和技术参考。

改进的单类协同过滤推荐方法

王鹏，景丽萍

北京交通大学交通数据分析与挖掘北京市重点实验室，北京 100044

Improved One-Class Collaborative Filtering for Recommendation System

􀆽

WANG Peng, JING Liping

Beijing Key Lab of Traffic Data Analysis and Mining, Beijing Jiaotong University, Beijing 100044, China

+ Corresponding author: E-mail: lpjing@bjtu.edu.cn

WANG Peng, JING Liping. Improved one-class collaborative filtering for recommendation system. Journal

of Frontiers of Computer Science and Technology, 2014, 8(10)：1231-1238.

Abstract: The sparsity of data and the lack of negative samples have a bad influence on the result of matrix factor-

ization based one-clas s collaborativ e filtering approach, s uch as features e xtracted are not obvious and low differen-

tiation between training results. This paper proposes an algorithm to choose positive and negative samples by consi-

dering both item similarity and user activity. With this algorithm, more positive samples can be added via the item

similarity and more negative samples can be added with the aid of the user activity. In this case, when matrix factor-

ization is used in one-class collaborative filering, the influence of the sparsity and the lack of negative samples can

be effectively reduced. A series of experiments show that the new algorithm can add positive and negative samples

more accurately, reduce the sparsity, and improve the recommendation accuracy.

Key words: matrix factorization; one-class collaborative filtering; sparsity; positive and negative samples

摘要：在使用矩阵分解方法解决单类协同过滤问题时，数据的稀疏性以及负样本的缺乏会导致分解特征提

取不明确，训练结果区分度低等诸多弊端。针对此问题提出了一种综合考虑物品相似度以及用户活跃度的正

负样本选择算法，根据物品相似度向原始数据中添加一定正样本，同时根据用户活跃度向每个用户添加不同

数量的负样本，从而减小了稀疏性和缺少负样本对使用矩阵分解方法解决单类协同过滤问题的影响。实验结

* The Fundamental Research Funds for the Central Universities of China under Grant No. 2014JBM029 (中央高校基本科研业务费专

项资金).

Received 2014-03, Accepted 2014-05.

CNKI网络优先出版：2014-05-16, http://www.cnki.net/kcms/doi/10.3778/j.issn.1673-9418.1403057.html

ISSN 1673-9418 CODEN JKYTA8

Journal of Frontiers of Computer Science and Technology

1673-9418/2014/08(10)-1231-08

doi: 10.3778/j.issn.1673-9418.1403057

E-mail: fcst@vip.163.com

http://www.ceaj.org

Tel: +86-10-89056056

王鹏，景丽萍.改进的单类协同过滤推荐方法[J].计算机科学与探索，2014，8（10）：1231-1238.

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38621250

粉丝: 2
资源: 908

基于物品相似度与用户活跃度的单类协同过滤推荐优化

一种基于自适应局部融合参数的协同过滤方法 (2014年)

"基于深度学习的可扩展协同过滤推荐系统

java 协同过滤推荐算法工具类

基于用户的协同过滤推荐的发展

基于深度自编码器神经网络的单类协同过滤方法，用于解决推荐系统中的单类问题

python协同过滤推荐算法

协同过滤推荐技术的应用

租房推荐协同过滤推荐算法和基于内容的推荐算法结合实现

协同过滤推荐 python 图书

协同过滤推荐算法java

最新资源