在pyspark 如何把 list类型转为rdd
时间: 2023-04-07 21:03:55 浏览: 385
PySpark RDD cheat Sheet
可以使用SparkContext.parallelize()方法将list类型转换为rdd,如下所示:
```
from pyspark import SparkContext
sc = SparkContext("local", "list to rdd")
list_data = [1, 2, 3, 4, 5]
rdd_data = sc.parallelize(list_data)
```
这样就可以将list类型的数据转换为rdd类型的数据了。
阅读全文