大规模机器学习系统架构设计与优化

22 浏览量更新于2024-08-29 收藏 992KB PDF 举报

大规模机器学习系统中的NoFreeLunch 大规模机器学习系统中的NoFreeLunch是指在企业机器学习应用系统中，核心模型训练系统的设计和优化考虑。涂威威，第四范式先知平台核心机器学习框架GDBT的设计者，分享了其在大规模分布式机器学习系统架构、机器学习算法设计和应用等方面的经验。 **机器学习目标定义** 机器学习的经典定义是利用经验（数据）来改善系统性能。在应用过程中，首先要明确机器学习目标的定义，也就是用机器学习来做什么事情。以谷歌提升搜索广告业务收入为例，谷歌首先对提升收入的目标进行拆解，确定了机器学习的优化目标是广告点击率。 **机器学习系统设计** 在确定了机器学习具体的优化目标后，机器学习系统会循环执行四个系统：数据收集→数据预处理→模型训练→模型服务。在这四个系统中，与机器学习算法最相关的就是模型训练系统。 **计算框架设计** 在涂威威看来，计算框架设计上，没有普适的最好框架，只有最适合实际计算问题的框架。针对机器学习的兼顾开发效率和执行效率的大规模分布式并行计算框架是非常重要的。 **大规模分布式机器学习计算框架** 在工业应用中，有效数据、特征维度正在迅速攀升。在数据量方面，以往一个机器学习任务仅有几万个数据，如今一个业务的数据量已很容易达到千亿级别。在特征维度方面，传统的机器学习采用“抓大放小”的方式—只使用高频宏观特征，忽略包含大量信息的低频微观特征—进行训练，但随着算法、计算能力、数据收集能力的不断增强，更多的低频微观特征被加入到机器学习训练中，使模型的效果更加出色。 **机器学习技术发展** 机器学习技术也在工业应用中不断发展，最早期的机器学习工业应用只利用宏观特征、简单模型，到后来发展为两个不同的流派：以微软为代表的基于模型的机器学习和以谷歌为代表的基于数据的机器学习。大规模机器学习系统中的NoFreeLunch是指企业机器学习应用系统中核心模型训练系统的设计和优化考虑，涵盖了机器学习目标定义、机器学习系统设计、计算框架设计、大规模分布式机器学习计算框架和机器学习技术发展等方面。

大规模机器学习系统中的大规模机器学习系统中的NoFreeLunch

作为第四范式?先知平台核心机器学习框架GDBT的设计者，涂威威在大规模分布式机器学习系统架构、机器学习算法设计和

应用等方面有深厚积累。演讲中，涂威威表示，现在有越来越多的企业开始利用机器学习技术，把数据转换成智能决策引擎。

企业机器学习应用系统中的核心模型训练系统有着什么样的设计和优化的考虑？与教科书中的机器学习应用相比，企业实际的

机器学习应用中有哪些容易被人忽略的陷阱？涂威威对此作了经验分享，同时给出了一些可供参考的解决方案。

工业界大规模分布式机器学习计算框架的设计经验

机器学习的经典定义，是利用经验（数据）来改善系统性能。在应用过程中，首先要明确机器学习目标的定义，也就是用机器

学习来做什么事情。以谷歌提升搜索广告业务收入为例，谷歌首先对提升收入的目标进行拆解，广告收入=平均单次点击价格

点击率广告展现量，其中“广告展现量”被硬性控制（考虑到政策法规和用户体验），“单次点击价格”受广告主主动出价影响，

与上面两者不同，“点击率”的目标明确，搜索引擎记录了大量的展现点击日志，而广告候选集很大，不同广告的点击率差别很

大，谷歌广告平台有控制广告展现的自主权，因此对于谷歌提升搜索广告收入的问题而言，机器学习最适合用来优化“广告点

击率”。在确定了机器学习具体的优化目标是广告点击率之后，谷歌机器学习系统会循环执行四个系统：数据收集→数据预处

理→模型训练→模型服务（模型服务产生的数据会被下一个循环的数据收集系统收集）。在这四个系统中，与机器学习算法最

相关的就是模型训练系统。

在涂威威看来，计算框架设计上，没有普适的最好框架，只有最适合实际计算问题的框架。

针对机器学习的兼顾开发效率和执行效率的大规模分布式并行计算框架

在工业应用中，有效数据、特征维度正在迅速攀升。在数据量方面，以往一个机器学习任务仅有几万个数据，如今一个业务的

数据量已很容易达到千亿级别。在特征维度方面，传统的机器学习采用“抓大放小”的方式—只使用高频宏观特征，忽略包含大

量信息的低频微观特征—进行训练，但随着算法、计算能力、数据收集能力的不断增强，更多的低频微观特征被加入到机器学

习训练中，使模型的效果更加出色。

特征频率分布

机器学习技术也在工业应用中不断发展，最早期的机器学习工业应用只利用宏观特征、简单模型，到后来发展为两个不同的流

派：以微软、雅虎为代表的只利用宏观特征但使用复杂模型流派，以谷歌为代表的使用简单模型但利用微观特征流派，到现

在，利用更多微观特征以及复杂模型去更精细地刻画复杂关系已是大势所趋。这便对模型训练提出了更高的要求。

下载后可阅读完整内容，剩余9页未读，立即下载

weixin_38716872

粉丝: 2
资源: 926

大规模机器学习系统架构设计与优化

基于机器学习的毫米波大规模MIMO混合预编码技术.pdf

吴恩达Andrew Ng机器学习中文讲义

Octopus(大章鱼）：基于R语言的跨平台大数据机器学习与数据分析系统

XGBoost：大规模机器学习的高效树增强系统

核极限学习机：一种高效的机器学习系统

Python机器学习电影推荐系统实战揭秘

高分Python机器学习网络入侵检测系统源码

Spark机器学习实战：智能客户系统开发

集成多种机器学习算法的水质预测系统

构建基于机器学习的二手车价格预测系统

最新资源