pyspark dataframe.selectExpr
时间: 2024-09-03 17:03:02 浏览: 133
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
5星 · 资源好评率100%
pyspark DataFrame.selectExpr()是一个用于DataFrame操作的关键函数,它允许你在Python表达式级别动态地构建SQL查询。`selectExpr()`方法接受一个包含字符串形式SQL表达式的列表,这些表达式会应用于DataFrame的每一列,生成新的列或直接从现有列计算出结果。
例如,如果你有一个名为df的DataFrame,你可以这样做:
```python
# 假设df有columns 'column1', 'column2'
expression = "column1 + column2"
new_df = df.selectExpr(expression)
```
在这个例子中,`selectExpr()`将返回一个新的DataFrame,其中包含原数据集中`column1`和`column2`相加的结果。
阅读全文