spark 筛选出非布尔类型的数据

假设我们有一个包含不同数据类型的DataFrame，我们可以使用`filter`方法结合`isInstanceOf`函数来筛选出非布尔类型的数据。例如，我们有如下的DataFrame： ```scala val df = Seq( (1, "hello", true), (2, "world", false), (3, 123, true), (4, 3.14, false) ).toDF("id", "value", "flag") ``` 我们想要筛选出所有非布尔类型的数据，可以使用以下代码： ```scala import org.apache.spark.sql.functions._ val nonBooleanDf = df.filter(!col("flag").isInstanceOf[Boolean] && !col("value").isInstanceOf[Boolean]) nonBooleanDf.show() ``` 输出结果为： ``` +---+-----+-----+ | id|value| flag| +---+-----+-----+ | 2|world|false| | 3| 123| true| | 4| 3.14|false| +---+-----+-----+ ``` 可以看到，我们成功地筛选出了非布尔类型的数据。

spark 2.2.0版本筛选出非布尔类型的数据

可以使用Spark SQL中的`isInstanceOf`函数来判断数据类型，并使用`filter`函数对数据进行筛选。例如，假设有一个DataFrame对象`df`，其中有一个名为`col`的列，我们希望筛选出其中非布尔类型的数据，可以使用以下代码： ```scala import org.apache.spark.sql.functions._ val filteredDF = df.filter(!col("col").isInstanceOf[Boolean]) ``` 这段代码中，`!col("col").isInstanceOf[Boolean]`表示`col`列中非布尔类型的数据，`filter`函数将DataFrame对象`df`中符合该条件的数据筛选出来，存储在`filteredDF`中。

spark 筛选出非字符串类型的数据

假设我们有一个包含不同数据类型的DataFrame，我们可以使用`filter`方法结合`isInstanceOf`函数来筛选出非字符串类型的数据。例如，我们有如下的DataFrame： ```scala val df = Seq( (1, "hello", true), (2, "world", false), (3, 123, true), (4, 3.14, false) ).toDF("id", "value", "flag") ``` 我们想要筛选出所有非字符串类型的数据，可以使用以下代码： ```scala import org.apache.spark.sql.functions._ val nonStringDf = df.filter(!col("value").isInstanceOf[String]) nonStringDf.show() ``` 输出结果为： ``` +---+-----+-----+ | id|value| flag| +---+-----+-----+ | 3| 123| true| | 4| 3.14|false| +---+-----+-----+ ``` 可以看到，我们成功地筛选出了非字符串类型的数据。

spark 筛选出非布尔类型的数据

spark 2.2.0版本 筛选出非布尔类型的数据

spark 筛选出非字符串类型的数据

相关推荐

人工智能-hadoop-基于hdfs spark的视频非结构化数据计算

基于Spark的零售交易数据分析

基于Spark的电影数据集分析

Spark DataSet中的数据筛选与转换实践

spark sql 支持读写那些类型数据

spark有哪几种基本数据类型

spark sql 怎么拆解数组类型数据

spark sql 怎么拆解object类型数据

spark sql支持读写哪些类型的数据

spark支持读写哪些类型的数据

spark sql支持的数据类型

Spark-shell中筛选出口味评分大于7分的数据

Spark SQL支持读写哪些类型的数据

spark又哪几种数据类型

spark数据类型转换函数

spark怎么筛选excel表格的数据并进行分析

spark 打印每一列的数据类型

最新推荐

实验七：Spark初级编程实践

大数据技术实践——Spark词频统计

Spark调优多线程并行处理任务实现方式

Jupyter notebook运行Spark+Scala教程

idea远程调试spark的步骤讲解

zigbee-cluster-library-specification

管理建模和仿真的文件

MATLAB柱状图在信号处理中的应用：可视化信号特征和频谱分析

HSV转为RGB的计算公式

JSBSim Reference Manual

spark 2.2.0版本筛选出非布尔类型的数据