阿里DeepRec:大规模稀疏模型训练与 Serving 解决方案
版权申诉
193 浏览量
更新于2024-07-05
收藏 23.52MB PDF 举报
"DeepRec是一个专为大规模稀疏模型设计的训练引擎,由阿里云计算平台事业部PAI的高级技术专家刘童璇开发。它基于TensorFlow分布式训练框架,旨在解决稀疏模型在训练性能、部署及在线服务中的挑战。主要功能包括:
1. **稀疏功能**:DeepRec针对稀疏数据进行优化,通过特征淘汰和准入策略,根据特征频率动态调整维度,如低频特征使用较低维度,高频特征则使用较高维度,以提高存储和计算效率。
2. **训练性能提升**:采用异步训练框架StarServer,如RunToCompletion和Lockless模式,以及图执行(GraphExecution)方法,支持数千个工作节点和数百个参数服务器,实现高效训练。同时,通过Runtime优化,如PRMalloc针对高维稀疏特征的大批量访问进行了优化,图优化方面强调了结构化特征的存储节省和用户网络计算开销的降低。
3. **部署及Serving**:支持多级混合存储和多Backend支持,能够处理超大稀疏模型,并提供高效的分布式 Serving。对于在线学习,DeepRec还实现了模型的增量导出和加载,以及Embedding的存储优化。
4. **通信协议与数据传输**:通过通信协议优化和用户态零拷贝数据传输,提高了通信效率。此外,基于图拓扑序的图Fusion技术进一步提升了系统性能。
5. **业务场景**:DeepRec适用于多种推荐系统场景,如猜你喜欢、推荐、主搜索、搜索、直通车定向广告等,充分体现了其在实际商业应用中的价值。
6. **开源与合作**:DeepRec是阿里核心搜索引擎推广业务的成果,得到了Intel和Nvidia的支持,并且是一个开放的平台,欢迎更多的外部公司合作。它不仅代表了阿里在稀疏模型领域的技术积累,也为整个社区提供了宝贵的训练和推理引擎资源。
DeepRec是一个综合性的解决方案,致力于解决大规模稀疏模型训练中的复杂问题,通过一系列优化技术,提升模型的训练效率和部署灵活性,为推荐系统的实时性和准确性提供了强大支持。"
2022-07-08 上传
2024-02-19 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
2022-03-18 上传
普通网友
- 粉丝: 12w+
- 资源: 9195
最新资源
- 单片机串口通信仿真与代码实现详解
- LVGL GUI-Guider工具:设计并仿真LVGL界面
- Unity3D魔幻风格游戏UI界面与按钮图标素材详解
- MFC VC++实现串口温度数据显示源代码分析
- JEE培训项目:jee-todolist深度解析
- 74LS138译码器在单片机应用中的实现方法
- Android平台的动物象棋游戏应用开发
- C++系统测试项目:毕业设计与课程实践指南
- WZYAVPlayer:一个适用于iOS的视频播放控件
- ASP实现校园学生信息在线管理系统设计与实践
- 使用node-webkit和AngularJS打造跨平台桌面应用
- C#实现递归绘制圆形的探索
- C++语言项目开发:烟花效果动画实现
- 高效子网掩码计算器:网络工具中的必备应用
- 用Django构建个人博客网站的学习之旅
- SpringBoot微服务搭建与Spring Cloud实践