DeepRec:高性能推荐场景深度学习框架

版权申诉
0 下载量 93 浏览量 更新于2024-06-14 收藏 4.09MB PDF 举报
"丁辰.pdf——DeepRec:面向推荐场景的高性能深度学习框架" 在本次分享中,丁辰探讨了DeepRec这一深度学习框架,它专为推荐系统设计,旨在应对大规模、高维度稀疏数据的挑战。DeepRec的开源历程展示了从早期的搜索、推荐到广告业务场景的应用,以及与各种模型技术的发展同步,如LR、GBDT+LR、FM、WDL、DeepFM、DCN(v2)、DIN、DIEN、DLRM和SIM等。这些模型在推荐系统中扮演着重要角色,从最初的线性模型到复杂的深度学习模型,不断推动着推荐效果的提升。 DeepRec的背景和开源历程揭示了推荐系统技术的演进。一个典型的推荐系统架构包括召回、排序和重排阶段,处理数以千万或百万计的用户和几万到几百个商品特征。随着模型复杂性的增加,如从稀疏模型到深度学习模型的转变,计算需求也大幅增长,这导致了像DeepRec这样专为处理PB级样本、上百GB至TB参数量、千亿规模特征和异构计算的框架的诞生。 DeepRec针对的挑战包括易用性、功能完善、高性能、框架灵活性和高可扩展性,以及完善的社区支持。它提供了异步/同步分布式训练、嵌入变量管理、无共享会话组、嵌入与优化器、训练、服务和部署等功能。此外,特色功能如特征剔除和过滤,有助于优化内存管理和提升模型效率。 DeepRec的开源历程始于2018年的PAI-TF,这是阿里巴巴内部统一的深度学习训练框架,基于TensorFlow进行了性能优化和功能增强。到了2022年,DeepRec正式开源,目前已被包括微博、得物、喜马拉雅、VIVO等在内的数十家公司采用,并于2023年捐赠给了LFAI(Linux Foundation AI)和DataFoundation,进一步推动了开源社区的发展。 展望未来,DeepRec将继续优化其在推荐场景中的性能,提升用户体验,增强模型训练和推理的效率,以及加强社区建设,提供更丰富的工具和资源,以适应快速发展的推荐系统和人工智能领域的需要。对于开发者和研究者而言,DeepRec是一个值得探索和应用的高性能框架,能够帮助他们有效地处理大规模推荐系统中的挑战。
2023-02-02 上传