scala dataframe删除列
时间: 2023-11-18 14:54:08 浏览: 230
可删除列的datagrid
要在 Scala 的 DataFrame 中删除列,可以使用 `drop` 方法。以下是一个简单的示例:
```scala
import org.apache.spark.sql.SparkSession
object DataFrameExample {
def main(args: Array[String]): Unit = {
val spark = SparkSession.builder()
.appName("DataFrameExample")
.master("local[*]")
.getOrCreate()
import spark.implicits._
// 创建一个示例 DataFrame
val data = Seq(
("Alice", 25, 5000),
("Bob", 30, 8000),
("Charlie", 35, 10000)
)
val df = data.toDF("Name", "Age", "Salary")
// 删除列
val updatedDF = df.drop("Salary")
updatedDF.show()
}
}
```
在上面的示例中,我们首先创建了一个示例的 DataFrame `df`,它包含三列:Name、Age 和 Salary。然后,我们使用 `drop` 方法删除了 Salary 列,将结果保存在新的 DataFrame `updatedDF` 中。最后,我们使用 `show` 方法打印出更新后的 DataFrame。
注意:`drop` 方法返回一个新的 DataFrame,原始的 DataFrame 不会被修改。
阅读全文