1. 数据来源于 package::nycflights13 (1) 将 flights 和 planes 进行连接,其中,最终结果应当保存 flights 中的所有 观测值并且保存 planes 中对应的观测值,并将结果命名为 flights_planes (5’) (2) 选取 flights_planes 中 tailnum 中含有字母 W 的观测值,并将选取出来的 数据框保存为新的 flights_planes(5’) (3) 剔除 flights_planes 中 engines 和 seats 缺失的观测值,然后将数据按照 engines 和 seats 分组,计算各组飞机在 2013 年的 distance 和 arr_delay 的总和,计算结果不能为 NA,将计算结果保存为新的数据 flights_sum(10’) (4) 利用上一问所得的 flights_sum,计算不同 engines 的总到达迟到时间和总 飞行距离(5’)
时间: 2024-03-07 13:49:46 浏览: 165
flights_flights_flights.json_echarts_
好的,让我来回答你的问题。
1. 使用以下代码连接 flights 和 planes 数据集,并将其保存为 flights_planes:
```
library(nycflights13)
flights_planes <- merge(flights, planes, by = "tailnum", all.x = TRUE)
```
2. 使用以下代码选取 flights_planes 中 tailnum 中含有字母 W 的观测值,并将其保存为新的 flights_planes:
```
flights_planes <- flights_planes[grep("W", flights_planes$tailnum), ]
```
3. 使用以下代码剔除 flights_planes 中 engines 和 seats 缺失的观测值,并按照 engines 和 seats 分组,计算各组飞机在 2013 年的 distance 和 arr_delay 的总和,并将其保存为新的数据 flights_sum:
```
flights_sum <- na.omit(flights_planes[c("engines", "seats", "distance", "arr_delay")])
flights_sum <- aggregate(cbind(distance, arr_delay) ~ engines + seats, flights_sum, sum)
```
4. 使用以下代码利用上一问所得的 flights_sum,计算不同 engines 的总到达迟到时间和总飞行距离:
```
aggregate(cbind(distance, arr_delay) ~ engines, flights_sum, sum)
```
阅读全文