R语言将 flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为 flights

您可以使用`merge()`函数将`flights`和`planes`两个数据框连接起来，具体代码如下： ```R flights <- merge(flights, planes, by = "tailnum", all.x = TRUE) ``` 这里将`flights`和`planes`按照`tailnum`这一列进行连接，`all.x = TRUE`表示保留`flights`中的所有观测值。最终结果将保存在`flights`数据框中。

1.数据：nycflights13，如果没有请先安装包(nyctights13 (1) 将flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为flights_planes （2）选取flights_planes 中 tailnum 中含有字母”W”的观测值，并将选取出来的数据框保存为新的 flights_planes （3）剔除flights_planes 中engines 和 seats 缺失的观测值，然后将数据按照 engines 和seats 分组，计算各组飞机在2013 年的distance 和 arrive_delay 的总和，计算结果不能为 NA，将计算结果保存为新的数据 flights_sum （4）利用上一问所得的flights_sum，计算不同 engines 的总到达迟到时间和总飞行距离，用r语言完成

首先需要下载并加载 `nycflights13` 包，并读取 `flights` 和 `planes` 数据集： ```r library(nycflights13) data(flights) data(planes) ``` (1) 连接 `flights` 和 `planes`，筛选出 tailnum 中含有字母 ”W“ 的观测值，并将结果保存为 `flights_planes`。 ```r flights_planes <- merge(flights, planes, by = "tailnum", all.x = TRUE) flights_planes_w <- flights_planes[grepl("W", flights_planes$tailnum), ] ``` (2) 剔除 `flights_planes_w` 中 engines 和 seats 缺失的观测值，然后将数据按照 engines 和 seats 分组，计算各组飞机在2013 年的 distance 和 arrive_delay 的总和，计算结果不能为 NA，将计算结果保存为新的数据 `flights_sum`。 ```r flights_clean <- flights_planes_w[complete.cases(flights_planes_w$engines, flights_planes_w$seats), ] flights_sum <- aggregate(cbind(distance, arrive_delay) ~ engines + seats, flights_clean, sum, na.rm = TRUE) ``` (3) 利用上一问所得的 `flights_sum`，计算不同 engines 的总到达迟到时间和总飞行距离。 ```r flights_sum_engines <- aggregate(cbind(distance, arrive_delay) ~ engines, flights_sum, sum) ``` 最终结果 `flights_sum_engines` 将展示各种飞机引擎数量的总到达迟到时间和总飞行距离。

1. 数据来源于 package::nycflights13 （1）将 flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为 flights_planes （5’）（2）选取 flights_planes 中 tailnum 中含有字母 W 的观测值，并将选取出来的数据框保存为新的 flights_planes（5’）（3）剔除 flights_planes 中 engines 和 seats 缺失的观测值，然后将数据按照 engines 和 seats 分组，计算各组飞机在 2013 年的 distance 和 arr_delay 的总和，计算结果不能为 NA，将计算结果保存为新的数据 flights_sum（10’）（4）利用上一问所得的 flights_sum，计算不同 engines 的总到达迟到时间和总飞行距离（5’）

(1) 要连接 flights 和 planes，可以使用 dplyr 包中的 left_join 函数，代码如下： ```{r} library(nycflights13) library(dplyr) flights_planes <- left_join(flights, planes, by = "tailnum") ``` 这里使用 tailnum 列作为连接的条件。 (2) 要选取 flights_planes 中 tailnum 中含有字母 W 的观测值，可以使用 grepl 函数进行模式匹配，代码如下： ```{r} flights_planes <- flights_planes[grepl("W", flights_planes$tailnum), ] ``` 这里使用 [] 子集选择符和 grepl 函数进行筛选。 (3) 要剔除 flights_planes 中 engines 和 seats 缺失的观测值，可以使用 dplyr 包中的 filter 函数进行筛选，并使用 group_by 和 summarize 函数计算各组飞机在 2013 年的 distance 和 arr_delay 的总和，代码如下： ```{r} flights_sum <- flights_planes %>% filter(!is.na(engines) & !is.na(seats)) %>% group_by(engines, seats) %>% summarize(sum_distance = sum(distance, na.rm = TRUE), sum_arr_delay = sum(arr_delay, na.rm = TRUE)) ``` 这里使用 %>% 管道符号和 dplyr 函数进行数据处理，其中 !is.na() 函数用于判断是否缺失，sum() 函数用于计算总和，na.rm = TRUE 表示在计算总和时忽略缺失值。 (4) 要计算不同 engines 的总到达迟到时间和总飞行距离，可以再次使用 group_by 和 summarize 函数进行计算，代码如下： ```{r} flights_sum_engines <- flights_sum %>% group_by(engines) %>% summarize(sum_distance = sum(sum_distance, na.rm = TRUE), sum_arr_delay = sum(sum_arr_delay, na.rm = TRUE)) ``` 这里只需要按照 engines 分组计算即可。

阅读全文

R语言 将 flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为 flights

相关推荐

OpenDDS-latest.rar_cannot8k1_flights8y_openDDS开发_opendds中文教程_ope

booking-flights-app:Mateo Codesido和PabloViña的Booking Flights应用演示

r语言dddddddddddd

R语言中 剔除 flights planes 中 engines 和 seats 缺失的观测值，然后将数据按照engines 和 seats 分组，计算各组飞机在 2013 年的 distance 和arrive delay 的总和，计算结果不能为 NA，将计算结果保存为新的数据flights sum

1.数据：nycflights13，如果没有请先安装包(nyctights13 (1) 将flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为flights_planes

【java毕业设计】校内跑腿业务系统源码（springboot+vue+mysql+说明文档）.zip

【java毕业设计】大学志愿填报系统源码（springboot+vue+mysql+说明文档）.zip

基于java的网吧管理系统答辩PPT.pptx

基于java的基于SSM架构的网上书城系统答辩PPT.pptx

tornado-6.1-cp37-cp37m-win32.whl

气泡排序、插入排序、选择排序、快速排序、希尔排序、堆排序、合并排序-SortAlgorithm.zip

Keyboard Maestro 11.0.3-macwk.dmg

基于微信小程序的鲜花销售微信小程序答辩PPT.pptx

【java毕业设计】智能推荐旅游平台源码（springboot+vue+mysql+说明文档）.zip

tornado-6.2b1-cp39-cp39-musllinux_1_1_x86_64.whl

【java毕业设计】東耳篮球馆会员信息管理系统源码（springboot+vue+mysql+说明文档）.zip

tornado-6.1b2-cp38-cp38-manylinux2014_aarch64.whl

最新推荐

【java毕业设计】校内跑腿业务系统源码（springboot+vue+mysql+说明文档）.zip

【java毕业设计】大学志愿填报系统源码（springboot+vue+mysql+说明文档）.zip

基于java的网吧管理系统答辩PPT.pptx

基于java的基于SSM架构的网上书城系统答辩PPT.pptx

tornado-6.1-cp37-cp37m-win32.whl

Aspose资源包：转PDF无水印学习工具

管理建模和仿真的文件

【R语言高性能计算秘诀】：代码优化，提升分析效率的专家级方法

在构建视频会议系统时，如何通过H.323协议实现音视频流的高效传输，并确保通信的稳定性？

Go语言控制台输入输出操作教程

R语言将 flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为 flights

R语言中剔除 flights planes 中 engines 和 seats 缺失的观测值，然后将数据按照engines 和 seats 分组，计算各组飞机在 2013 年的 distance 和arrive delay 的总和，计算结果不能为 NA，将计算结果保存为新的数据flights sum