LLMRec:大语言模型在推荐系统中的数据增强应用

需积分: 0 1 下载量 70 浏览量 更新于2024-08-03 收藏 616KB DOCX 举报
"LLMRec: Large Language Models with Graph Augmentation for Recommendation 是一篇关于将大语言模型应用于推荐系统的论文。作者提出了一种方法,通过利用LLMs的丰富知识和自然语言处理能力,对用户-商品隐式反馈、用户资料以及商品属性进行增强,以改善推荐系统的性能。该方法旨在解决LLMs在推荐系统中的应用难题,如幻觉问题和输入长度限制,并通过数据增强策略提高推荐的准确性和可靠性。" 在推荐系统领域,LLMs(大语言模型)的应用面临诸多挑战。传统的协同过滤(CF)范式虽然有效,但LLMs可能会产生幻觉,即输出与实际情况不符的信息,这对需要精确预测用户喜好的推荐系统是个问题。为了解决这个问题,论文提出了将LLMs用于数据增强,具体包括:增强用户-商品隐式反馈、生成用户资料以及改进商品属性。这样的增强策略有助于充分利用数据集中的文本信息,同时保持推荐系统的准确性。 然而,将LLMs直接应用于推荐存在两个主要挑战。首先,由于LLMs的输入通常受到最大令牌长度的限制,无法直接处理大规模的商品数据,尤其是在线上环境中需要快速召回和排序的商品。为此,研究者建议使用基础推荐模型(如LightGCN)先筛选出一小部分候选商品集,然后利用LLMs进行更精细的评估和排序,从而克服输入长度的限制。 其次,LLMs生成的数据增强可能存在噪声,影响推荐的可靠性。为了减少噪声,论文提出了两种策略。对于增强的隐式反馈,采用剪枝方法去除不可靠的信号;对于增强的特征,应用了Mean Absolute Error (MAE)等模型来去除不一致或错误的信息,以提高数据增强的质量和稳定性。 LLMRec通过结合图增强和数据增强策略,成功地将大语言模型集成到推荐系统中,既保留了经典推荐模型的准确度,又发挥了LLMs在理解和处理文本信息方面的优势,为推荐系统的未来发展提供了新的思路和解决方案。