请用r语言帮我完成以下题目:请使用 nycflight13 回答以下问题: (1) 请用 flights 表单找出出发时间没有延误,但是到达时间有延误的所有航班。 (2) 在(1)数据的基础上计算到达每个目的地的航班数量,平均飞行距离和平均到达 延 误时间。 (3) 在(2)的基础上在一张图中画出平均到达延误时间和平均飞行距离关系的散点图 和 平滑曲线图。 (4) 用 flights 数据,然后根据 origin 和 time_hour 两个变量与 weather 表格 进行左连接
时间: 2024-03-14 21:47:48 浏览: 452
好的,我会尽力回答您的问题。以下是使用 R 语言回答您的问题:
(1)请用 flights 表单找出出发时间没有延误,但是到达时间有延误的所有航班。
```R
library(nycflights13)
# 找到出发时间没有延误,但是到达时间有延误的所有航班
flights %>%
filter(dep_delay == 0, arr_delay > 0)
```
(2)在(1)数据的基础上计算到达每个目的地的航班数量,平均飞行距离和平均到达延误时间。
```R
# 计算到达每个目的地的航班数量、平均飞行距离和平均到达延误时间
flights %>%
filter(dep_delay == 0, arr_delay > 0) %>%
group_by(dest) %>%
summarize(
flights_num = n(),
avg_distance = mean(distance),
avg_arr_delay = mean(arr_delay)
)
```
(3)在(2)的基础上在一张图中画出平均到达延误时间和平均飞行距离关系的散点图和平滑曲线图。
```R
library(ggplot2)
# 绘制平均到达延误时间和平均飞行距离关系的散点图和平滑曲线图
flights %>%
filter(dep_delay == 0, arr_delay > 0) %>%
group_by(dest) %>%
summarize(
flights_num = n(),
avg_distance = mean(distance),
avg_arr_delay = mean(arr_delay)
) %>%
ggplot(aes(x = avg_distance, y = avg_arr_delay)) +
geom_point() +
geom_smooth(method = "loess") +
labs(title = "Average Arrival Delay vs Average Distance by Destination")
```
(4)用 flights 数据,然后根据 origin 和 time_hour 两个变量与 weather 表格进行左连接
```R
library(dplyr)
# 根据 origin 和 time_hour 两个变量与 weather 表格进行左连接
flights_weather <- left_join(flights, weather, by = c("origin", "time_hour"))
```
希望对您有所帮助!
阅读全文