R语言 将 flights 和 planes 进行连接,其中,最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值,并将结果命名为 flights
时间: 2024-03-14 10:48:31 浏览: 21
您可以使用`merge()`函数将`flights`和`planes`两个数据框连接起来,具体代码如下:
```R
flights <- merge(flights, planes, by = "tailnum", all.x = TRUE)
```
这里将`flights`和`planes`按照`tailnum`这一列进行连接,`all.x = TRUE`表示保留`flights`中的所有观测值。最终结果将保存在`flights`数据框中。
相关问题
1.数据:nycflights13,如果没有请先安装包(nyctights13 (1) 将flights 和 planes 进行连接,其中,最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值,并将结果命名为flights_planes
首先,我们需要加载数据包并读取数据。请确保您已经安装了nycflights13包。
``` r
library(nycflights13)
# 连接 flights 和 planes
flights_planes <- merge(flights, planes, by = "tailnum")
# 查看连接后的数据
head(flights_planes)
```
这将输出连接后的数据的前几行,其中包含flights和planes中的所有变量。现在,我们已经成功连接了flights和planes数据,并将结果保存为flights_planes。
1.数据:nycflights13,如果没有请先安装包(nyctights13 (1) 将flights 和 planes 进行连接,其中,最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值,并将结果命名为flights_planes (2) 选取flights_planes 中 tailnum 中含有字母”W”的观测值,并将选取出来 的数据框保存为新的 flights_planes (3)剔除flights_planes 中engines 和 seats 缺失的观测值,然后将数据按照 engines 和seats 分组,计算各组飞机在2013 年的distance 和 arrive_delay 的总和,计算结果不能为 NA,将计算结果保存为新的数据 flights_sum (4) 利用上一问所得的flights_sum,计算不同 engines 的总到达迟到时间和 总飞行距离。用r语言完成
首先,安装并加载 `nycflights13` 包,并加载其所需的依赖包:
```r
install.packages("nycflights13")
library(nycflights13)
library(dplyr)
```
第一问:将 `flights` 和 `planes` 进行连接,其中,最终结果应当保存 `flights` 中的所有观测值并且保存 `planes` 中对应的观测值,并将结果命名为 `flights_planes`
```r
flights_planes <- flights %>% left_join(planes, by = "tailnum")
```
第二问:选取 `flights_planes` 中 `tailnum` 中含有字母 "W" 的观测值,并将选取出来的数据框保存为新的 `flights_planes`
```r
flights_planes <- flights_planes %>% filter(grepl("W", tailnum))
```
第三问:剔除 `flights_planes` 中 `engines` 和 `seats` 缺失的观测值,然后将数据按照 `engines` 和 `seats` 分组,计算各组飞机在 2013 年的 `distance` 和 `arrive_delay` 的总和,计算结果不能为 `NA`,将计算结果保存为新的数据 `flights_sum`
```r
flights_sum <- flights_planes %>%
na.omit(select = c("engines", "seats", "distance", "arr_delay")) %>%
group_by(engines, seats) %>%
summarise(distance_sum = sum(distance, na.rm = TRUE),
arrive_delay_sum = sum(arr_delay, na.rm = TRUE))
```
第四问:利用上一问所得的 `flights_sum`,计算不同 `engines` 的总到达迟到时间和总飞行距离。
```r
engines_sum <- flights_sum %>%
group_by(engines) %>%
summarise(distance_sum = sum(distance_sum, na.rm = TRUE),
arrive_delay_sum = sum(arrive_delay_sum, na.rm = TRUE))
```
最终结果保存在 `engines_sum` 数据框中,其中 `distance_sum` 为不同引擎型号飞机的总飞行距离,`arrive_delay_sum` 为不同引擎型号飞机的总到达迟到时间。