pd.dataframe 转pyspark
时间: 2024-01-17 22:04:50 浏览: 134
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
5星 · 资源好评率100%
要将pandas DataFrame转换为pyspark DataFrame,可以使用SparkSession的createDataFrame方法。以下是一个示例代码:
```python
from pyspark.sql import SparkSession
import pandas as pd
# 创建SparkSession
spark = SparkSession.builder.getOrCreate()
# 创建pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['col1', 'col2', 'col3'])
# 将pandas DataFrame转换为pyspark DataFrame
pyspark_df = spark.createDataFrame(df)
# 显示pyspark DataFrame
pyspark_df.show()
```
这将创建一个pyspark DataFrame,并使用show方法显示其内容。
阅读全文