val filteredDF: DataFrame = df.filter(substr(df("name"),1,2) = "Ch")
时间: 2023-11-11 19:05:01 浏览: 102
你可以使用 `substr` 函数进行字符串的子串截取操作,并将其与 `filter` 方法结合使用来过滤 DataFrame 中满足条件的行。下面是一个示例:
```scala
import org.apache.spark.sql.functions._
import org.apache.spark.sql.{SparkSession, DataFrame}
// 创建 SparkSession
val spark = SparkSession.builder()
.appName("DataFrameFilterExample")
.master("local")
.getOrCreate()
// 创建一个示例 DataFrame
val data = Seq(
("Alice", 25, "F"),
("Bob", 30, "M"),
("Charlie", 35, "M"),
("Diana", 28, "F")
)
val df = spark.createDataFrame(data).toDF("name", "age", "gender")
// 使用 filter 方法进行过滤
val filteredDF: DataFrame = df.filter(substr(df("name"), 1, 2) === "Ch")
// 显示过滤后的结果
filteredDF.show()
```
在上面的示例中,我们使用 `substr` 函数截取 `name` 列的前两个字符,并将其与字符串 `"Ch"` 进行比较,通过 `filter` 方法筛选出满足条件的行。最后,使用 `show` 方法显示结果。
运行以上代码,将输出满足条件的行,即以 "Ch" 开头的姓名。
阅读全文