数据: nycflights13, 如果没有请先安装包(nycflights13)|
时间: 2024-03-16 09:44:46 浏览: 69
redisplus.zip
5星 · 资源好评率100%
好的,以下是针对您提供的数据集 `nycflights13` 的代码实现:
1. 连接 `flights` 和 `planes` 数据集,保存为 `flights_planes`:
```R
library(nycflights13)
# 连接数据集
flights_planes <- merge(flights, planes, by = "tailnum", all.x = TRUE)
```
2. 选取 `flights_planes` 中 `tailnum` 中含有字母 "W" 的观测值,保存为 `flights_planes_W`:
```R
flights_planes_W <- subset(flights_planes, grepl("W", tailnum))
```
3. 剔除 `flights_planes` 中 `engines` 和 `seats` 缺失的观测值,分组计算 `engines` 和 `seats` 的总和,保存为 `flights_sum`:
```R
# 剔除缺失值
flights_planes_complete <- na.omit(flights_planes)
# 分组计算总和
flights_sum <- aggregate(cbind(distance, arrive_delay) ~ engines + seats, data = flights_planes_complete, sum)
```
4. 利用 `flights_sum` 计算不同 `engines` 的总到达延迟时间和总飞行距离:
```R
# 分组计算总和
flights_sum_engines <- aggregate(cbind(distance, arrive_delay) ~ engines, data = flights_sum, sum)
```
阅读全文