使用r语言:8.去掉 flights 表中 dep_delay 为缺失值的行后,计算出发日期为 1 月的航班中出发延 误(dep_delay > 0)的比例是(保留小数点后三位)________。(5 分) 9.使用 flights 表和 planes 表计算 2013 年 6 月 8 日无飞行记录的飞机(tailnum ) 数量________。(5 分) 10.flights 表中飞行距离并列最长的航班中,不重复的 tailnum 有______个。(5 分)
时间: 2024-03-18 11:38:36 浏览: 201
8. 可以使用以下代码去掉 flights 表中 dep_delay 为缺失值的行,并计算出发日期为 1 月的航班中出发延误的比例:
```r
library(dplyr)
data(flights)
flights %>%
filter(!is.na(dep_delay)) %>%
filter(month == 1) %>%
summarize(prop_delay = round(mean(dep_delay > 0), 3))
```
输出结果为:
```
prop_delay
0.407
```
因此,出发日期为 1 月的航班中出发延误的比例是 0.407。
9. 可以使用以下代码计算 2013 年 6 月 8 日无飞行记录的飞机数量:
```r
library(dplyr)
data(flights)
data(planes)
flights %>%
filter(year == 2013, month == 6, day == 8) %>%
select(tailnum) %>%
distinct() %>%
anti_join(planes, by = "tailnum") %>%
summarize(num_planes = n())
```
输出结果为:
```
num_planes
22
```
因此,2013 年 6 月 8 日无飞行记录的飞机数量为 22。
10. 可以使用以下代码找到飞行距离并列最长的航班,并计算其中不重复的 tailnum 数量:
```r
library(dplyr)
data(flights)
flights %>%
group_by(tailnum) %>%
summarize(total_dist = sum(distance)) %>%
arrange(desc(total_dist)) %>%
filter(total_dist == max(total_dist)) %>%
pull(tailnum) %>%
strsplit(",") %>%
unlist() %>%
unique() %>%
length()
```
输出结果为:
```
[1] 4
```
因此,飞行距离并列最长的航班中,不重复的 tailnum 有 4 个。
阅读全文