Scala的dataframe中现有一列数据,含有多个[500–100]的数据,现求每个数据的平均数
时间: 2024-05-09 09:19:13 浏览: 92
求平均数的代码
假设这列数据的列名为col,可以按照以下步骤求每个数据的平均数:
1. 将col列按照"-"拆分成两列,一列为起始值start,一列为结束值end:
```
val splitCol = split(col, "-")
val df = df.withColumn("start", splitCol.getItem(0).cast("int"))
.withColumn("end", splitCol.getItem(1).cast("int"))
```
2. 计算每个数据的平均值,即(start+end)/2:
```
val avgCol = (df("start") + df("end")) / 2
```
完整代码如下:
```
val splitCol = split(col, "-")
val df = df.withColumn("start", splitCol.getItem(0).cast("int"))
.withColumn("end", splitCol.getItem(1).cast("int"))
val avgCol = (df("start") + df("end")) / 2
```
阅读全文