KDD2022：通用序列表征学习在推荐系统中的新突破

需积分: 0 92 浏览量更新于2024-08-03 收藏 528KB PDF 举报

"这篇文档是关于2022年KDD大会收录的论文，主题是通用序列表征学习在推荐系统中的应用。作者探讨了如何通过建模物品的文本描述来学习可迁移的通用表征，以解决传统方法中依赖物品ID导致的数据孤岛问题。论文提出了UniSRec模型，该模型包含参数白化和混合专家增强适配器，以及基于多域负样本的对比预训练任务，以学习通用的序列特征。" 在推荐系统中，序列表征学习是一个关键环节，尤其在行为序列分析中，它有助于理解和预测用户的兴趣。传统的序列表征学习方法通常基于物品ID，这限制了模型的泛化能力，使其难以适应新环境或平台。因此，来自人民大学和阿里巴巴的研究团队提出了一种新颖的方法，通过利用物品的文本描述来学习更通用的表征。论文提出的 UniSRec 模型旨在解决这个问题。首先，模型利用预训练的BERT模型编码物品的文本特征，生成初步的文本表示。然而，由于BERT学到的特征可能具有领域特异性，作者引入了参数白化技术，通过对原始BERT表征进行线性转换，以减少特征的各向异性，促进跨领域的语义一致性。此外，为了处理不同场景之间的差异并实现域融合，UniSRec采用了混合专家（MoE）架构。MoE包含多个白化转换模块，即专家，这些专家能够适应不同场景的特定需求。通过MoE增强适配器，模型可以综合不同场景下的表征，提高通用性。论文还提出了一种基于多域负样本的对比预训练任务，这有助于学习更具通用性的序列表征。通过这种方式，模型能够在各种场景中捕获丰富的上下文信息，即使对于交互较少的冷启动物品也能有效处理。实验结果表明，UniSRec在多个推荐系统场景下表现出色，证明了这种方法的有效性。论文源代码已经公开，可以在GitHub上找到，供研究者和实践者进一步探索和使用。这篇论文为推荐系统的通用序列表征学习提供了新的视角和解决方案，对于打破数据孤岛、提升推荐系统的迁移性和泛化性能具有重要意义。

概述

在序列推荐中，大多数序列表征学习方法依赖于显式的物品信息，这使得训练学习到

的模型比较专有化，很难迁移到新的推荐场景或平台。此外，现有的序列表征学习方

法往往很难处理交互很少的冷启动物品。

那么如何解决呢？

可以构建这样一个数据形式。给定按交互时间排列的序列，每个元素关联唯一的物品I

D和描述文本。描述文本包含了若干共享词汇表里的词汇。这里，每个序列包括用户

在某一特定场景下的所有交互行为，且一个用户可以在不同场景或平台有多个行为序

列。多个序列之间独立而不混合在一起。

剩余11页未读，继续阅读

毕业小助手

粉丝: 2743
资源: 5583

KDD2022：通用序列表征学习在推荐系统中的新突破

新版完整标准 IEC 62093-2022.pdf

2011-2022年北大数字普惠金融指数数据（包括省市县）.zip

Python库 | torchrec_nightly-2022.2.10-py37-none-any.whl

JAXB2 jaxb-api.jar jaxb-xjc.jar jaxb-impl.jar activation.jar

commons-codec-1.3.jar和commons-httpclient-3.0.jar

Python学习笔记(干货) 中文PDF完整版.pdf

时间序列分析及应用：R语言（原书第2版）.pdf

Microsoft SQL Server 2005技术内幕： T-SQ程序设计.pdf

java-jdk-8u51-windows-x64.exe.zip

Java语言程序设计-基础篇(原书第8版).pdf

最新资源