Transformation算子
时间: 2024-01-17 12:06:04 浏览: 79
Transformation算子是Spark中的一种操作,用于对已知的RDD进行转换。它们通过一系列转换算子,将原始RDD的数据由一种形态转化为新的一种形态。常见的Transformation算子包括map、flatMap、filter、join、sample、groupByKey、reduceByKey、sortByKey等等。\[2\]这些操作具有lazy懒加载的特点,也就是说只有在遇到作业执行时,才会触发这些操作。值得注意的是,takeSample算子是一个action算子,而不是transformation算子,因为它会将抽样的数据加载到driver中。\[3\]
#### 引用[.reference_title]
- *1* *3* [spark算子--transformation篇](https://blog.csdn.net/zhaolimin6666/article/details/87874701)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [5.Transformation(转换算子)](https://blog.csdn.net/wenqiangW_/article/details/114476030)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文