spark dataframe 求平均值并保留2位小数

可以使用`agg`函数和`round`函数来求平均值并保留2位小数。以下是一个示例代码： ```python from pyspark.sql import SparkSession from pyspark.sql.functions import avg, round # 创建SparkSession spark = SparkSession.builder.getOrCreate() # 创建一个DataFrame data = [("Alice", 25), ("Bob", 30), ("Charlie", 35)] df = spark.createDataFrame(data, ["name", "age"]) # 求平均值并保留2位小数 result = df.agg(round(avg("age"), 2).alias("average_age")) # 显示结果 result.show() ``` 输出结果应为： ``` +-----------+ |average_age| +-----------+ | 30.00| +-----------+ ``` 在上面的示例中，我们使用`avg`函数计算了年龄的平均值，然后使用`round`函数将结果保留两位小数。最后，我们使用`alias`方法给结果列命名为"average_age"。

def analyse(data: DataFrame): DataFrame = { val spark: SparkSession = data.sparkSession import spark.implicits._ logInfo("/ 分析各个用户ID的交易金额最大值、最小值、平均值等信息，按照平均值降序排列 /") val save = udf { x: Double => x.formatted("%.2f") } }

好的，你可以将代码修改为以下形式来实现对 DataFrame 的分析操作并返回一个 DataFrame： ``` def analyse(data: DataFrame): DataFrame = { val spark: SparkSession = data.sparkSession import spark.implicits._ logInfo("/**************** 分析各个用户ID的交易金额最大值、最小值、平均值等信息，按照平均值降序排列 ****************/") // 将原始 DataFrame 按用户 ID 进行分组，并且计算每个用户的交易金额总和、最大值、最小值、平均值等信息 val result = data.groupBy("user_id") .agg( sum("amount").as("total_amount"), max("amount").as("max_amount"), min("amount").as("min_amount"), avg("amount").as("avg_amount") ) // 对结果按照平均值降序排列，并将交易金额保留两位小数 result.select($"user_id", $"total_amount", $"max_amount", $"min_amount", save($"avg_amount").as("avg_amount")) .orderBy($"avg_amount".desc) } ``` 这段代码使用了 Spark SQL 中的 `groupBy`、`agg` 和 `orderBy` 等函数，对原始的 DataFrame 进行了分组、聚合和排序等操作，并且定义了一个 UDF 函数 `save`，用于将交易金额保留两位小数。最后，该代码返回一个按照用户平均交易金额降序排列的 DataFrame。

阅读全文

spark dataframe 求平均值并保留2位小数

相关推荐

pandas和spark dataframe互相转换实例详解

spark dataframe 将一列展开,把该列所有值都变成新列的方法

Spark学习笔记（三）：Spark DataFrame

Origin教程009所需练习数据

大模型的稀疏激活方法及其高效推理应用研究：基于dReLU激活函数

STM32F103+PWM+DMA精准控制输出脉冲的数量和频率 源程序

白色大气风格的商务团队公司模板下载.zip

2023-04-06-项目笔记 - 第三百五十八阶段 - 4.4.2.356全局变量的作用域-356 -2025.12.25

白色大气风格的个人摄影图片博客网站源码下载.zip

白色大气风格的木材加工行业网站模板下载.zip

PCle AI加速卡在智能制造中的应用.docx

VB+SQL房地产评估系统设计(源代码+系统)(2024d7).7z

白色风格的后台管理系统模板下载.rar

网络热点采集与分析系统的构建及应用

白色大气风格的KTV美女麦霸网站模板下载.zip

白色简洁风的博客网站模板下载.zip

梧州市五险一金办事指南.docx

白色简洁风格的餐厅服务团队整站网站源码下载.zip

白色大气风格的境外游景区模板下载.zip

最新推荐

pandas和spark dataframe互相转换实例详解

spark rdd转dataframe 写入mysql的实例讲解

Spark dataframe使用详解

RStudio中集成Connections包以优化数据库连接管理

管理建模和仿真的文件

Keil uVision5全面精通指南

flink提交给yarn19个全量同步MYsqlCDC的作业，flink的配置参数怎样设置

PHP博客旅游的探索之旅

"互动学习：行动中的多样性与论文攻读经历"

【单片机编程实战】：掌握流水灯与音乐盒同步控制的高级技巧

STM32F103+PWM+DMA精准控制输出脉冲的数量和频率源程序