在scala中将dataframe的列值提取为list
时间: 2023-11-22 09:54:39 浏览: 147
DataFrame:通过SparkSql将scala类转为DataFrame的方法
在 Scala 中,你可以使用 `collect_list` 函数将 DataFrame 的列值提取为 List。以下是一个示例代码:
```scala
import org.apache.spark.sql.functions._
val df = Seq(
(1, "John"),
(2, "Jane"),
(3, "Bob"),
(4, "Alice")
).toDF("id", "name")
val nameList = df.agg(collect_list("name")).as[Seq[String]].head
println(nameList)
```
这个代码将 `df` 中的 `name` 列提取为一个 String 类型的 List,并打印出来。
阅读全文