知乎News Feed的机器学习演进:从Edge Rank到DNN推荐

需积分: 5 13 下载量 71 浏览量 更新于2024-07-19 收藏 5.3MB PDF 举报
"AICon2018-《知乎 News Feed 中的机器学习实践》-张瑞" 在本次演讲中,张瑞分享了知乎 News Feed 产品的机器学习实践,包括其后端策略的演进过程,从早期的时间排序、EdgeRank 到 Learning to Rank,再到基于深度神经网络(DNN)的推荐系统。 1. **知乎 News Feed 产品简介** - **内容来源**:知乎 News Feed 包含用户主动关注的内容和被动推荐的内容,以及编辑精选。 - **内容类型**:涵盖问题、回答、文章、专栏、Live、电子书、视频等多种形式,满足用户的多元化信息需求。 2. **知乎 News Feed 后端策略演进** - **时间排序**:最初,News Feed 按照内容的发布时间进行展示,但随着用户增长,信息过载问题出现,导致信噪比增大。 - **EdgeRank**:为解决这个问题,知乎引入了 EdgeRank 策略,它通过计算内容的时效性、相关度和类型权重来决定内容的排名。EdgeRank 的优点在于简单易解,但缺点是过于简陋,对数据的利用能力有限,且参数调整缺乏有效指导。 - **Learning to Rank**:进一步改进,通过机器学习算法来学习如何根据用户的行为和内容属性进行更精确的排序。 - **DNN Based Recommendation**:最终,知乎采用了基于深度神经网络的推荐系统,能够更深入地理解和学习用户行为模式,提供更加精准的个性化推荐。 3. **机器学习实践** - **训练数据采集与处理**:包括数据清洗、采样、特征选择和变换,确保数据质量,以适应模型训练的需求。 - **模型训练与评估**:根据业务目标设计损失函数,选择合适的模型进行训练,并通过在线或离线效果评估来验证模型性能。 4. **总结** - 知乎 News Feed 的演进展示了推荐系统在应对用户增长和信息过载挑战时的技术迭代。从简单的规则到复杂的深度学习模型,这些变化反映了机器学习在提升用户体验和内容发现效率上的重要作用。 通过这些策略和实践,知乎能够提供更加个性化和有价值的信息流,增强用户对平台的粘性和满意度。同时,这也体现了机器学习在信息推荐领域中的核心地位,即通过不断学习和优化,提升推荐的准确性和用户体验。
2021-02-13 上传