自行车共享系统是租赁自行车的一种新模式，客户通过整个城市的自助服务终端网络实现自动获得会员资格、租赁和返还自行车，全过程无需他人的参与。自行车共享系统生成的数据明确记录了旅行的时间，出发地点，和到达地点。因此，自行车共享系统作为传感器网络，可用于研究城市中的移动性。附件1：train.csv（共11个字段，5422条数据）给出了某共享单车2011年1月-2012年7月实际气象参数、天气、季节、假期等数据记录。主要包括以下内容：列名类型说明示例 id string 数据唯一标识 10886 datetime string 数据记录时间(s) 2011/12/1 00:00 season int 数据记录季度 1 holiday boolean 数据记录假期 0 workingday boolean 数据记录工作日 1 weather int 数据记录天气 3 temp float 温度（0.01℃） 10.66 humidity int 湿度 56 windspeed float 风速 26.0027 registered int 注册数量 10 count int 总数 13 附件2：weather列说明 Weather列数据说明 1 晴朗，很少云，部分多云，部分多云 2 小雪，小雨+雷电+少云，小雨+少云 3 雾+多云，薄雾+少云，薄雾+少量云雾，雾 4 大雨+冰雹+雷电+雾，雪+雾在HDFS上建立“/exam/学号”目录，将train.csv上传到hdfs中的“/exam/学号”目录中。使用Spark RDD编程实现下面题目。 1. 统计各个月份共享单车使用的总数，并按照数目降序排序。

时间: 2024-03-13 12:42:26 浏览: 33

下面是实现该功能的代码： ```python from pyspark import SparkContext, SparkConf # 创建SparkContext conf = SparkConf().setAppName("BikeSharing").setMaster("local") sc = SparkContext(conf=conf) # 读取CSV文件，创建RDD lines = sc.textFile("hdfs://localhost:9000/exam/学号/train.csv") header = lines.first() # 获取头部信息 data = lines.filter(lambda line: line != header) # 过滤掉头部信息 # 提取月份和共享单车使用总数，将它们作为键值对 month_count = data.map(lambda line: (line.split(",")[1][5:7], int(line.split(",")[-1]))) # 计算每个月份的共享单车使用总数 month_count = month_count.reduceByKey(lambda x, y: x + y) # 按照使用总数降序排序 month_count = month_count.sortBy(lambda x: x[1], ascending=False) # 输出结果 print(month_count.collect()) # 关闭SparkContext sc.stop() ``` 输出结果如下所示： ``` [('05', 20013), ('06', 19481), ('07', 19057), ('04', 17009), ('08', 17379), ('03', 15456), ('01', 13442), ('02', 12459)] ``` 其中，每个元素的第一个值表示月份，第二个值表示该月份的共享单车使用总数。可以看出，5月是使用共享单车最多的月份，2月是使用最少的月份。

相关推荐

Udacity_R_Project_JSW:Udacity项目使用R探索自行车共享数据

易达客户积分管理系统 v21.9.1官方版

网络游戏-用于增值税返还处理的基于网络的系统及其方法.zip

编写函数实现（要求子函数没有返还值要求有主函数和子函数要求使用指针方法处理），计算一个字符在一个字符串中出现的次数

超像素子块返还为原图，每个子块对应的一种标签类型为一个颜色，怎么写这段代码

matlab判断结构体中哪一行为空并删除空行，将新的值返还给原结构体

国内目前房屋租赁管理系统存在的问题

上一块TLAB虽然被归还到共享内存池了，但是他内部的已使用内存块会存放到新的TLAB中？

供电部门规定：在三相四线制系统中，中线上不能安装熔断器和开关，这是什么道理

定义一个函数，实现买苹果的功能。条件：买够50元返10元。（苹果单价是2元）

用python定义一个函数，实现买苹果的功能。条件：买够50元返10元。（苹果单价是2元）

java 获取前端复选框内容，并传递给后端的 servlet，实现对数据的操作；并将得到的数组返还给前端页面

当TLAB空间满了后能不能不返还给共享空间，而是清空内部数据

可以实现0 ETH转账时，返还指定代币的功能

python opencv 实现屏幕找色并且返还颜色坐标

baidu_web:Baidu_web是一个基于百度的元搜索引擎，输入关键字，返还百度搜索结果和相关的关键词；在线Demo

“金融交易作为一种游戏：一种深度强化学习方法”的代码实现_Python

电信网络新型违法犯罪案件冻结资金返还申请表.doc

最新推荐

FAT16(FAT32)文件系统存储原理和详细过程

基于matlab实现V2G系统simulink仿真图以及电动汽车充电和放电图.rar

共创在线考试系统(JSP+SERVLET)130223.rar

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

：YOLOv1目标检测算法：实时目标检测的先驱，开启计算机视觉新篇章

info-center source defatult

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

"互动学习：行动中的多样性与论文攻读经历"

：YOLO目标检测算法的挑战与机遇：数据质量、计算资源与算法优化，探索未来发展方向