Spark弹性部署:Mesos上的大数据处理
需积分: 10 198 浏览量
更新于2024-07-23
收藏 4.21MB PDF 举报
"Paco Nathan在Spark Summit 2013上的演讲主要介绍了如何在Elastic Mesos上运行Spark,以及如何使用PMML导入各种数据分析框架的预测模型,如R、SAS、SPSS、SAP和Microstrategy等。演讲者是Mesosphere公司的Paco Nathan,讨论了使用Mesos的原因,并探讨了大数据、云计算与Spark在企业应用中的场景。"
在这次演讲中,Paco Nathan首先阐述了使用Mesos的重要性。Mesos源于对谷歌Borg系统的借鉴,Borg是一种大规模数据中心计算的系统,旨在解决大规模数据工作流的复杂性。Mesos利用现代内核实现资源隔离,而不是依赖虚拟机,支持混合工作负载和多租户环境,实现了较高的资源利用率。虽然JVM在某些场景下并不理想,但Mesos的调度能力在处理批量作业时较为简单,而在服务调度方面则相对复杂和昂贵。
接着,Paco Nathan介绍了如何在Mesos集群上部署Spark,演示了如何启动Mesos集群并运行Spark。Spark on Mesos能够提供弹性扩展性和高效率,使得在企业环境中处理大数据任务变得更加便捷。此外,他还展示了基于PMML(Predictive Model Markup Language)的一个示例应用。PMML是一种标准的XML格式,用于在不同的分析工具之间交换预测模型。通过PMML,Spark可以与多种数据分析框架集成,如R、SAS、SPSS、SAP和Microstrategy,使得企业能充分利用已有的模型和算法。
演讲还提及了Google的数据中心计算机概念,以及2011年Google发布的Omega项目,这些都是对大规模分布式系统设计的深入研究。Omega由John Wilkes等人提出,旨在提高数据中心操作的灵活性和效率,这些理念对Mesos的设计和发展产生了影响。
这场演讲揭示了Spark与Mesos结合在大数据和云计算领域的强大潜力,以及PMML在跨平台数据分析中的作用。它为企业提供了如何利用Mesos来管理和调度资源,以及如何通过Spark进行高效大数据处理的宝贵见解。
2019-07-17 上传
2021-02-04 上传
2024-12-23 上传
2024-12-23 上传
四轮独立驱动横摆角速度控制,LQR 基于LQR算法的 基于二自由度动力学方程,通过主动转向afs和直接横摆力矩dyc实现的横摆角速度跟踪 ,模型包括期望横摆角速度,质心侧偏角,稳定性因素,lqr模块等
2024-12-23 上传
2024-12-23 上传
2024-12-23 上传
2024-12-23 上传
villa123
- 粉丝: 418
- 资源: 236
最新资源
- 响应式鲜花全屏网站模板
- doubly_linked_list_lab
- huffmanandprufer:生成用于文件压缩的霍夫曼树并使用Prufner编码霍夫曼树
- phpProyect
- 控制5台电机顺启逆停PLC程序.rar
- SoftUni-CSharp-Entity-Framework-Core:实体框架核心作业和考试
- nwinters13.github.io:课程管家
- LINGO11.rar
- poc-sugar-monitor:血糖监测仪的POC
- SimpleFootie:简单的足球比赛引擎模拟-开源
- 信息104
- 电信设备-基于线性时序逻辑的移动机器人最优巡回路径设定方法.zip
- snailfwd-site-special:snailfwd 特殊项目模板
- 货梯PLC程序.rar
- phone-shop:“梨电话店”出售
- 乌托邦-RESTful:用PHP编写的Utopia Network RESTful API