pyspark dataframe转换为list
时间: 2023-04-29 18:03:00 浏览: 174
Python 将DataFrame数据转换成列表 Python源码
可以使用`collect()`方法将Pyspark DataFrame转换为Python List。例如:
```python
from pyspark.sql import SparkSession
# 创建SparkSession
spark = SparkSession.builder.appName("DataFrameToList").getOrCreate()
# 创建DataFrame
data = [("Alice", 25), ("Bob", 30), ("Charlie", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# 将DataFrame转换为List
list_data = df.collect()
# 打印List
print(list_data)
```
输出结果为:
```
[Row(Name='Alice', Age=25), Row(Name='Bob', Age=30), Row(Name='Charlie', Age=35)]
```
注意:`collect()`方法将整个DataFrame加载到内存中,如果DataFrame非常大,可能会导致内存不足的问题。因此,在使用`collect()`方法时,需要谨慎考虑DataFrame的大小。
阅读全文