在数据漂移下关于前者,已经提出了更好地反映现实推荐场景的改进的数据分割技术,
例如, 时间分割,,顺序的
最后一项预测分割
和重复的时间感知分割
,
。
关于
后者,多年来已经提出了大量的时间和序列感知算法。对于一个全面的概述,我们
建议感兴趣的读者坎波斯等人。
,
和
,
等人
和
等人。
的文件。
与我们的工作相关,
和
总结了两种处理
数据流中概念漂移的通用方法。
第一种方法是利用预定义
并将其用作数据上的滑动
窗口。 第二种是利用衰落因子,使得较
旧的交互
对相似性的影响较小。
使用了上下文流行度算法,
等于
分钟,
分钟和小时,在年的计划中取得了巨大成功。类似地, 表明,使用
较小或使用衰减
因 子的计算流行度提 供 了 更 强 的基 线。
和
和
等人。
发现类似的迹象表明,训练数据的新近性在零售环境中很重要 我们的工
作受到这些早期努力的启发,旨在进一步锚定和扩大他们的研究结果,关于
流行和基于相似
性的算法,以其他类型的推荐算法,如时间和会话感知算法。这种时间感知算法的示例
是
使用衰落因子的基于邻域的模型
,
,
,
,
,
,类似于
和
。最近,我们看到了序列和会话感知算法,它们利用用户历史中的顺序来学习
序列
模型。 这种方法的例子是
,
顺序规则
,
和
。在
之后,越来越多
的深度学习方法被提出来合并顺序和
或时间
信息。
、
、。
最近的可重复性研究对这些复杂的深度学习方法在各个领域的性能提出了挑战。在
两个最近的作品,等人。,
发现
等人研究了
深度学习方法的
性能,与会话环境中的简单基线相比。 他说:
在大多数情况下, 事实证明,简单的技术
优于最近的神经方法我们遵循他们的结果,并在我们的实验中专注于更简单的基线
3.
方法
3.1.
建议方案
在许多现实世界的应用中,推荐系统用于在用户查看其他文章或产品时为用户生成在这
些用例中,用户的兴趣通常主要通过他们最近的交互来捕获。
模拟这种情况
的标准评估
协议是执行
拆分
,
,
或迭代揭示
。
我们修改了
评估,以最好地近似生产环境中通常使用的(重复)训练和
服务架构,并避免将未来的信息泄露到我们的模型训练中
。 只有时间戳之前的数据
,
即模型
在服务之前重新训练的时间,才用于训练。考虑到