Bike_share 数据集记录了 2011 年 1 月 1 日到 2012 年 12 月 31 日华盛顿地 区每天各小时共享单车的租赁情况。其中变量 workingday = 0 表示非工作 日,workingday = 1 表示工作日,casual 为临时用户租车量,registered 为注册用户租车量,count 为总租车量(casual+registered)。如何用r语言增加一列 season,season 将 month 分为 4 组:1-3 月为"spring", 4-6 月为"summer",7-9 月为"autumn",10-12 月为"winter",将其保存为 bike_share2,然后统计各季节的平均租车量。
时间: 2023-12-14 21:38:48 浏览: 62
可以使用R语言中的dplyr包和mutate函数来增加一列season,代码如下:
``` r
library(dplyr)
# 读取数据
bike_share <- read.csv("bike_share.csv")
# 增加一列season
bike_share2 <- bike_share %>%
mutate(season = case_when(month %in% c(1,2,3) ~ "spring",
month %in% c(4,5,6) ~ "summer",
month %in% c(7,8,9) ~ "autumn",
month %in% c(10,11,12) ~ "winter"))
# 计算各季节的平均租车量
season_count <- bike_share2 %>%
group_by(season) %>%
summarize(avg_count = mean(count))
# 输出结果
season_count
```
这段代码首先使用read.csv函数读取原始数据,然后使用mutate函数增加一列season,其中使用case_when函数将month分为四个季节。最后,使用group_by和summarize函数计算各季节的平均租车量,并将结果保存在season_count中。
阅读全文