def meanAge(dataFrame: DataFrame): Double = { dataFrame .select("Age") .na.drop() .agg(round(mean("Age"), 0)) .first() .getDouble(0) }
时间: 2024-03-31 17:37:45 浏览: 43
一个简单的年龄算法
5星 · 资源好评率100%
这是一个 Scala 函数,输入参数为一个 Spark DataFrame,输出为一个 Double 类型的平均年龄值。这个函数首先从 DataFrame 中选择 "Age" 列,然后使用 `na.drop()` 方法删除包含空值的行。接着,它使用 `agg` 方法计算 "Age" 列的平均值,并使用 `round` 函数将结果四舍五入为整数。最后,它使用 `first` 方法获取计算结果的第一行(因为 `agg` 方法的返回结果是一个 DataFrame),并使用 `getDouble(0)` 方法获取该行的第一个值,即平均年龄值。
阅读全文