spark sql编程实验 汽车
时间: 2023-11-17 14:02:38 浏览: 231
spark编程基础实验三数据
这是一个关于使用Spark SQL进行汽车销售记录分析的编程实验。实验中需要完成以下步骤:
1. 将汽车销售记录上传至HDFS;
2. 使用编程方式定义RDD模式,提取月、市、区县、品牌、车辆类型、使用性质和数量7列,并定义相应Schema;
3. 将(2)的结果以json格式保存至HDFS;
4. 读取该json文件,构建DataFrame;
5. 在DataFrame中使用SQL语句实现如下查询:
- 统计各汽车品牌的销量,并按销量从高到低排序;
- 统计各月各汽车品牌的销量;
- 统计各市的汽车销量,并按销量从低到高排序;
- 统计不同城市不同车辆类型的销量;
- 统计各城市汽车销量最大的区县;
- 统计1~6月非营运车辆销量最大的前3大品牌。
阅读全文