旅行推荐算法探索:从ESMM到ESM^2

版权申诉
0 下载量 168 浏览量 更新于2024-07-11 收藏 1.89MB PDF 举报
"旅行场景下的推荐算法探索.pdf" 在旅行场景下,推荐算法是提升用户体验、增加用户黏性和商业价值的关键技术。本资料由阿里巴巴集团高级算法专家温鸿(青干)分享,主要探讨了电商推荐算法及其在飞猪平台的应用。 电商推荐算法简介: 推荐系统通常包括多种技术框架,如逛逛、订阅、商家私域、猜你喜欢以及Push等。这些场景各有特点,服务于不同的用户需求。推荐技术的核心目标是根据用户的兴趣和行为,提供个性化的产品或服务推荐。 高效推荐方案: 为了提供实时、精准的推荐,采用客户端+边缘计算的策略,结合ABFS(Alibaba Big File System)、BE(Backend Engine)和IGRAPH、RTP(Real-time Processing)等工具,构建了一套高效的TPP(Triple-Phase Prediction)推荐方案。这一方案能够处理大量的用户行为数据,快速生成和更新用户和商品的表示,以支持实时推荐。 基础能力与数据处理: 推荐系统的基石包括用户表、商品表和行为表,它们存储了丰富的用户信息、商品属性和用户行为记录。日志收集和基础数据处理是关键步骤,涵盖了统计类、向量类、序列类和反馈类的数据。特征抽取和样本生成用于训练模型,而机器学习平台则提供了模型校验和模型上线的能力。 模型与算法: 推荐算法通常涉及多种机器学习模型,如协同过滤、深度学习模型如DIN(Deep Interest Network)和DIEN(Deep Interest Evolution Network)。这些模型可以捕捉用户的短期和长期兴趣,提高推荐的准确性。此外,还有全空间的CVR(Conversion Rate,转化率)预估模型,如ESMM(Entire Space Multi-Task Modeling)和ESM^2。 CVR预估挑战与解决方案: 传统的CVR模型面临样本选择偏差(SSB)、数据稀疏性(DS)和购买正样本缺乏的问题。ESMM模型通过引入CTR(Click-Through Rate,点击率)和CTCVR(Click-to-Conversion Rate,点击到转化率)作为辅助任务,解决了这些问题。它利用共享Embedding缓解DS问题,并通过全空间的任务推导消除SSB。然而,ESMM模型忽略了用户购买决策的复杂性,以及购买正样本缺乏的影响。 ESM^2模型的改进: ESM^2模型针对ESMM的不足,提出引入合适的post-click行为来缓解购买正样本的缺乏,并通过全空间建模来解决SSB问题。多任务学习的方法被用于更准确地预测转化率,将用户行为分解为多个阶段,从而更好地理解和预测用户的购买决策过程。 总结与展望: 旅行场景下的推荐算法将继续发展和完善,未来可能涉及更复杂的用户行为理解、更精确的个性化推荐,以及更高效的计算架构。随着技术的进步,推荐系统将更好地服务于旅行者,提升其在各个阶段的体验,同时也为商家提供更有效的营销策略。