腾讯Mariana深度学习平台:助力语音图像识别与广告优化

5星 · 超过95%的资源 需积分: 17 967 下载量 43 浏览量 更新于2024-07-22 7 收藏 2.18MB PDF 举报
"邹永强在2014年的BDTC会议上分享了腾讯深度学习平台Mariana的进展和应用情况,该平台针对不同的应用需求,构建了DNN、CNN和Cluster三套框架,广泛应用于微信的语音识别和图像识别,以及广点通广告的优化。" 腾讯深度学习的应用需求主要体现在以下几个方面: 1. **微信语音识别**:微信作为拥有庞大用户基数的社交平台,其语音输入功能和语音开放平台对深度学习技术有着强烈需求。通过深度学习,可以提高语音识别的准确性和速度,提供更好的用户体验。 2. **微信图像识别**:微信图像识别功能,如长按语音消息转文字,依赖深度学习技术来解析和理解图片内容,提升识别效率和准确性。 3. **广点通广告**:腾讯的广告系统如广点通,利用深度学习优化效果广告的点击率,通过对用户行为的深度理解,实现个性化推荐,提高广告效益。 腾讯深度学习平台Mariana面临的主要挑战包括: 1. **模型复杂度**:深度神经网络模型的复杂性,需要处理大量的训练数据和进行大规模计算。 2. **数据量大**:以微信语音识别为例,模型包含超过5亿参数,训练样本超过40亿,这要求平台能够高效处理大数据。 3. **大模型支持**:为了提升性能,需要支持更深更宽的网络结构。 4. **超参数调优**:深度学习模型的训练涉及众多超参数,需要进行反复试验和优化。 Mariana平台通过以下方式解决挑战: 1. **Mariana DNN**:设计了专门针对多GPU的数据并行框架,用于处理深度神经网络,提高训练速度。 2. **Mariana CNN**:针对深度卷积神经网络,开发了多GPU并行框架,适用于图像识别等任务,充分利用GPU的并行计算能力。 3. **Mariana Cluster**:为应对更大规模的计算需求,构建了CPU集群框架,能够在大规模分布式系统上运行深度学习任务。 4. **GPU Cluster**:Mariana还引入了GPU集群,进一步提升计算效率,加速模型训练。 Mariana平台通过技术创新和架构设计,成功地满足了腾讯在语音识别、图像识别和广告优化等场景的深度学习需求,展现了深度学习在实际业务中的强大应用潜力。