1、从flights数据中找到到达时间延误两小时或更多的所有航班,并将生成的新数据集保存为flights_arr2hr
时间: 2024-03-17 07:45:31 浏览: 70
可以使用 dplyr 包来从 flights 数据中找到到达时间延误两小时或更多的所有航班,然后将生成的新数据集保存为 flights_arr2hr。具体代码如下:
```R
library(dplyr)
# 从 flights 数据中找到到达时间延误两小时或更多的所有航班
flights_arr2hr <- flights %>%
filter(arr_delay >= 120)
# 将生成的新数据集保存为 flights_arr2hr
write.csv(flights_arr2hr, "flights_arr2hr.csv", row.names = FALSE)
```
其中,filter() 函数用于筛选数据,保留满足条件的行。arr_delay 表示到达时间延误的分钟数,因此 arr_delay >= 120 表示到达时间延误两小时或更多。最后使用 write.csv() 函数将生成的新数据集保存为 flights_arr2hr.csv 文件。
相关问题
flights 数据中筛选出出发时间延误 1 小时或更多的航班,并将生成的新数 据保存为 flights_dep1hr
假设您已经加载了`flights`数据集,可以按以下步骤筛选出出发时间延误1小时或更多的航班,并将生成的新数据保存为`flights_dep1hr`:
```
# 筛选出出发时间延误1小时或更多的航班
flights_dep1hr <- subset(flights, dep_delay >= 60)
# 将新数据保存为CSV文件,文件名为flights_dep1hr.csv
write.csv(flights_dep1hr, file = "flights_dep1hr.csv", row.names = FALSE)
```
上述代码中,`subset()`函数用于基于条件筛选数据集,第一个参数是要筛选的数据集,第二个参数是筛选条件。在本例中,条件是`dep_delay >= 60`,表示出发延误时间超过1小时。`write.csv()`函数用于将数据保存为CSV文件。第一个参数是要保存的数据集,第二个参数是要保存的文件名,第三个参数`row.names`设置为`FALSE`表示不保存行名。
探索 nycflights13 数据集 1. 从 flights 数据中找出到达时间延误 2 小时或者更多的所有航班,并将生成的新数据 保存为 flight_arr2hr。(5 分) 2. 将生成的 flight_arr2hr 数据集根据目的地(dest)进行分组,统计出抵达每个目的地 的航班数量,筛选出抵达航班数量前十名的目的地,将结果命名为 top10_dest。(5 分) 3. 从 weather 表中挑选出以下变量:year, month, day, hour, origin, humid, wind_speed, 并将其与 flight_arr2hr 表根据共同变量进行左连接, 生成的新数据保存为 flight_weather (5 分) 4. 基于 flight_weather 数据集,根据不同出发地(origin)在平行的三个图中画出风速 wind_speed(x 轴)和出发延误时间 dep_delay(y 轴)的散点图,以及平滑曲线。 (5 分) 5. flights 中每家航空公司在 2013 年有多少班次的航班被取消了?提示:依据 dep_time 来判断某班次航班是否被取消(5 分) 6. 找出 flights 中每一家航空公司的航班最常去的目的地机场,以及 flights 中每家航空 公司飞往最常去的目的地机场的航班数量 (10 分)
抱歉,作为AI语言模型,我无法进行本地数据集操作。可以提供一些思路和代码示例供您参考。
1. 找出到达时间延误 2 小时或者更多的航班:
```R
library(nycflights13)
flight_arr2hr <- flights[flights$arr_delay >= 120, ]
```
2. 统计抵达每个目的地的航班数量,筛选出抵达航班数量前十名的目的地:
```R
top10_dest <- flight_arr2hr %>%
group_by(dest) %>%
summarise(n = n()) %>%
arrange(desc(n)) %>%
slice(1:10)
```
3. 在 weather 表中选择所需变量,与 flight_arr2hr 表进行左连接:
```R
flight_weather <- flight_arr2hr %>%
select(year, month, day, hour, origin) %>%
left_join(weather, by = c("year", "month", "day", "hour", "origin"))
```
4. 根据不同出发地,绘制风速和出发延误时间的散点图和平滑曲线:
```R
library(ggplot2)
ggplot(flight_weather, aes(x = wind_speed, y = dep_delay)) +
geom_point() +
geom_smooth() +
facet_wrap(~origin, ncol = 3)
```
5. 统计每家航空公司在 2013 年取消的航班数量:
```R
flights_cancelled <- flights %>%
filter(year == 2013, is.na(dep_time)) %>%
group_by(carrier) %>%
summarise(n = n())
```
6. 找出每家航空公司最常去的目的地机场以及对应的航班数量:
```R
most_common_dest <- flights %>%
group_by(carrier, dest) %>%
summarise(n = n()) %>%
group_by(carrier) %>%
filter(n == max(n))
```
阅读全文