没有合适的资源?快使用搜索试试~ 我知道了~
首页Spark常用的算子以及Scala函数总结.pdf
资源详情
资源评论
资源推荐
2019/5/9 Spark常用的算子以及Scala函数总结 - 云+社区 - 腾讯云
https://cloud.tencent.com/developer/article/1335240 1/11
Spark常用的算子以及Scala函数总结
Spark与Scala
首先,介绍一下scala语言:
Scala 是一种把面向对象和函数式编程理念加入到静态类型语言中的混血儿。
为什么学scala?
spark提供了R、Python等语言的接口,为什么还要重新学一门新的语言呢?
1、spark本身就是用scala写的,采用与底层框架相同的语言有很多好处,例如以后你要看源
码......
2、性能开销小,scala可以直接编译运行在java的JVM上
3、能用上最新的版本。一般新版本都是最先支持scala,虽然现在python的接口也在不断的丰
富
4、到了工作岗位,你的师父(都是有几年相关经验的),前期由于python的支持还没有像
scala那样完善,因此会从scala开始使用spark的,你不学scala还让你师父转python啊!
新手学习Spark编程,在熟悉了Scala语言的基础上,首先需要对以下常用的Spark算子或者Scala函
数比较熟悉,才能开始动手写能解决实际业务的代码。
简单来说,Spark 算子大致可以分为以下两类:
1. Transformation 变换/转换算子:这种变换并不触发提交作业,完成作业中间过程处理。
Transformation 操作是延迟计算的,也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是
马上执行,需要等到有 Action 操作的时候才会真正触发运算。
2. Action 行动算子:这类算子会触发 SparkContext 提交 Job 作业。
Action 算子会触发 Spark 提交作业(Job),并将数据输出 Spark系统。
从小方向来说,Spark 算子大致可以分为以下三类:
1. Value数据类型的Transformation算子,这种变换并不触发提交作业,针对处理的数据项是Value型
的数据。
2. Key-Value数据类型的Transfromation算子,这种变换并不触发提交 作业,针对处理的数据项是
Key-Value型的数据对。
3. Action算子,这类算子会触发SparkContext提交Job作业
流川枫
发表于
AI星球
942
分享
2
专栏 问答 沙龙 快讯 团队主页 开发者手册 在线学习中心 TVP
备案 控制台腾讯云首页
菜单
douxnxa
- 粉丝: 11
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0