LLMRec：大语言模型在推荐系统中的数据增强应用

需积分: 0 70 浏览量更新于2024-08-03 收藏 616KB DOCX 举报

"LLMRec: Large Language Models with Graph Augmentation for Recommendation 是一篇关于将大语言模型应用于推荐系统的论文。作者提出了一种方法，通过利用LLMs的丰富知识和自然语言处理能力，对用户-商品隐式反馈、用户资料以及商品属性进行增强，以改善推荐系统的性能。该方法旨在解决LLMs在推荐系统中的应用难题，如幻觉问题和输入长度限制，并通过数据增强策略提高推荐的准确性和可靠性。" 在推荐系统领域，LLMs（大语言模型）的应用面临诸多挑战。传统的协同过滤（CF）范式虽然有效，但LLMs可能会产生幻觉，即输出与实际情况不符的信息，这对需要精确预测用户喜好的推荐系统是个问题。为了解决这个问题，论文提出了将LLMs用于数据增强，具体包括：增强用户-商品隐式反馈、生成用户资料以及改进商品属性。这样的增强策略有助于充分利用数据集中的文本信息，同时保持推荐系统的准确性。然而，将LLMs直接应用于推荐存在两个主要挑战。首先，由于LLMs的输入通常受到最大令牌长度的限制，无法直接处理大规模的商品数据，尤其是在线上环境中需要快速召回和排序的商品。为此，研究者建议使用基础推荐模型（如LightGCN）先筛选出一小部分候选商品集，然后利用LLMs进行更精细的评估和排序，从而克服输入长度的限制。其次，LLMs生成的数据增强可能存在噪声，影响推荐的可靠性。为了减少噪声，论文提出了两种策略。对于增强的隐式反馈，采用剪枝方法去除不可靠的信号；对于增强的特征，应用了Mean Absolute Error (MAE)等模型来去除不一致或错误的信息，以提高数据增强的质量和稳定性。 LLMRec通过结合图增强和数据增强策略，成功地将大语言模型集成到推荐系统中，既保留了经典推荐模型的准确度，又发挥了LLMs在理解和处理文本信息方面的优势，为推荐系统的未来发展提供了新的思路和解决方案。

WSDM 2024 LLMRec 大语言模型在推荐系统中的应用

Paper: LLMRec: Large Language Models with Graph Augmentation for Recommendation

Code: github LLMRec

一. 背景问题和解决思路

将大语言模型用于推荐系统已经成为近期的研究热点，但是如何让 LLMs 有效地助力于推

荐系统一直是一个悬而未决的问题。一方面，经典 CF 范式已经发展了许多年，这是很多学

界和业界的工作者共同努力得到的最有效的范式；另一方面，LLMs 存在着幻觉问题

（Hallucination）, 因此很难适配需要准确预测用户偏好的推荐系统。本篇工作提出用 LLMs

为推荐系统做数据增强，即，利用 LLMs 丰富的知识和卓越的自然语言理解能力进行 i）

user-item 隐式反馈的增强 ii) user profile 的生成 iii) 和 item attribute 的增强。这种方式既能

保证基础的推荐系统的准确性，又充份利用了数据集中的文本信息和大语言模型的能力。

普通的有基础 side information 的推荐系统的输入: 由 side information 编码的 feature F + 历

史交互的隐式反馈。

有数据增强的推荐系统输入: 增强的 feature + 增强的隐式反馈。

二. 存在的挑战和应对方案

1.如何让 LLMs 进行推荐?

大语言模型能够自然地进行 NLP 的任务，但是从未针对推荐进行设计和训练。此外，目前

主流公平的推荐测试大都使用 all-item rank, 并且业界 online 的召回、粗排和精排任务的 item

数据量也很大。因此，让输入受'max token length'限制的 LLM 进行推荐和测试看起来不太可

能实现。

对此，我们提出用基础的推荐模型(e.g.，LightGCN)得到数量有限的 item candidates 集供 LLMs

选择，以解决语言模型输入长度受限的问题。

2.如何让增强的数据更可靠，避免噪声的影响？

基于 LLM 的数据增强本质来说是给推荐系统引入外部知识。尽管这些知识来自于真实世界

(新闻、论坛、维基百科等互联网上的大量文本)，但对于特定任务和数据集，噪音是不可避

免的。如何最大程度地确保数据增强的可用性和可靠性是一个关键问题。

下载后可阅读完整内容，剩余5页未读，立即下载

无意识积累中

粉丝: 160
资源: 28

LLMRec：大语言模型在推荐系统中的数据增强应用

LLMRec-基于大语言模型(ChatGPT)的个性化基于内容的多模态推荐系统.docx

ai学习教程.docx

大模型相关教程.docx

ChatGPT背后的经济账.docx

LangChain 编程的简要介绍.docx

AI人工智能技术培训1.docx

Sora 的 OpenAI 概念简要介绍.docx

Redis7引领内存数据库新纪元.docx

使用 Python 中的 Langchain 从零到高级快速进行工程.docx

用于人类行为理解的自动移动传感策略生成.docx

最新资源