首页object Data_aggregation { def main(args: Array[String]): Unit = { //这里更换其它类型的蔬菜数据 val inputFile = "datas/ziganlan.csv"; val conf = new SparkConf().setAppName("demo1").setMaster("local") val sc = new SparkContext(conf) val sqc = new SQLContext(sc) // 创建spark session val spark = SparkSession.builder().config(conf).getOrCreate() val textFile = sc.textFile(inputFile) val FileRDD = textFile.map( line => { val year = line.split(",")(4).split("-")(0) val month = line.split(",")(4).split("-")(1) val times = year+"-"+month val name = line.split(",")(0) val lowprice = line.split(",")(1).toDouble val minprice = line.split(",")(2).toDouble val topprice = line.split(",")(3).toDouble (name,lowprice,minprice,topprice,times) } ) FileRDD.foreach(println)

object Data_aggregation { def main(args: Array[String]): Unit = { //这里更换其它类型的蔬菜数据 val inputFile = "datas/ziganlan.csv"; val conf = new SparkConf().setAppName("demo1").setMaster("local") val sc = new SparkContext(conf) val sqc = new SQLContext(sc) // 创建spark session val spark = SparkSession.builder().config(conf).getOrCreate() val textFile = sc.textFile(inputFile) val FileRDD = textFile.map( line => { val year = line.split(",")(4).split("-")(0) val month = line.split(",")(4).split("-")(1) val times = year+"-"+month val name = line.split(",")(0) val lowprice = line.split(",")(1).toDouble val minprice = line.split(",")(2).toDouble val topprice = line.split(",")(3).toDouble (name,lowprice,minprice,topprice,times) } ) FileRDD.foreach(println)

时间: 2024-03-31 14:34:54 浏览: 45

这段代码是使用Spark对蔬菜价格数据进行聚合操作的示例，具体实现步骤如下： 1. 首先定义输入文件路径和Spark配置信息，并创建SparkContext和SQLContext对象。 2. 使用SparkSession对象创建SparkSession实例。 3. 使用SparkContext的textFile方法读取输入文件，并使用map方法对每行数据进行处理，提取出年份、月份、蔬菜名称、最低价、最高价和平均价等信息，并将这些信息封装到元组中。 4. 使用foreach方法输出处理后的数据。这段代码实现了对蔬菜价格数据的简单处理和聚合操作，将不同蔬菜的价格按照年份和月份进行聚合，并输出处理后的数据。需要注意的是，这只是一个简单的示例，实际的数据处理和聚合过程可能会更加复杂和精细。

阅读全文