scala spark指定的列将""替换为null

您可以使用 Scala 中的 `na` 函数来将指定列中的空字符串替换为 `null`。具体代码如下： ``` import org.apache.spark.sql.functions._ val df = Seq( ("John", "", "Doe"), ("", "Michael", "Smith"), ("Jane", "Doe", "") ).toDF("first_name", "middle_name", "last_name") val columnsToReplace = Seq("first_name", "middle_name", "last_name") val dfWithNulls = columnsToReplace.foldLeft(df){ (currentDF, column) => currentDF.withColumn(column, when(col(column) === "", null).otherwise(col(column))) } dfWithNulls.show() ``` 其中，`foldLeft` 函数用来遍历需要替换为 `null` 的列。`withColumn` 函数用来判断列中的值是否为 `""`，如果是，则替换为 `null`，否则保持原值。最后通过 `show()` 函数来打印数据。

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通