1688推荐系统深度解析:从I2I到U2I的演变与实践

版权申诉
0 下载量 87 浏览量 更新于2024-07-05 收藏 9.75MB PDF 举报
"3-7+1688推荐系统实践" 是由董宇在2019年12月发布的关于阿里巴巴1688平台推荐系统实践的研究报告。这份文档详细记录了1688推荐系统的发展历程,从2017年开始,逐步推进了召回与排序算法的优化。 在2017年,推荐系统的召回阶段主要采用了不平衡的I2I方法和SWING及E-TREC等启发式策略,这些方法具有良好的普适性和高效实时召回性能,同时具有较高的可解释性。SWING结构是典型的例子,它结合了搜索和推荐技术,能快速处理大规模商品。 随着技术的发展,到了2018年,引入了深度学习模型如DeepMatch,用于召回和排序任务。CTR(点击率)方面,从LR(逻辑回归)和GBDT(梯度提升决策树)逐渐演变为更复杂的模型,如W&DL(权重和深度学习)。同时,CVR(转化率)也采用深度学习方法,如DIN(深度 Interest Network)和DIEN(深度 Interest Evolution Network),并且引入了意图识别和CTR/CVR调权机制。 2019年,推荐系统进一步深化,引入了多兴趣DeepMatch,强化了召回的多样性。粗排阶段采用GBDT到双塔模型,CTR任务中使用了DMR(在AAAI20上提出的模型),CVR则应用了ESMM(Enhanced Sequential Matching Model)和MMOE(Multi-Modal Online Embedding)模型。内容化推荐方面,异构网络被用来召回多样化信息,排序则通过HIN(Heterogeneous Information Network)-MTL(Multi-Task Learning)-DBM(Deep Bayesian Model)模型进行优化。 在商品召回部分,DeepMatch作为关键组件,不仅提升了召回效率,还利用深度模型的强大表达能力和丰富的用户行为信息,如类别属性和行为序列。然而,其缺点在于缺乏明确的触发因素,解释性较差,需要通过A/B测试来评估效果。 此外,文档还提到了从I2I(Item-to-Item)召回到U2I(User-to-Item)的转变,其中LFM(Latent Factor Model)和基于序列上下文的Attention用户表征方法被用来建模用户行为。U2I召回,如YouTubeDeepMatch,利用深度学习解决召回效率问题,同时考虑非对称共现行为,并具有向量化能力,但牺牲了一定的解释性。 总结来说,这份报告展示了1688推荐系统从传统方法到深度学习技术的演进过程,以及在召回和排序策略上的创新,强调了深度学习在提升推荐系统性能的同时带来的挑战和优化方向。