用r语言完成，在flights中，按dest分组，考虑arr_delay列，去除dest列中NA值。将dest按字母顺序，由小至大，求每组中arr_delay>0的比例，分三种情况,不去除NA值，去除NA值，NA值的个数只按50%计算。如（1，2，-1，NA，NA）计算结果0.4， 0.666，0.5. 三列的名字为prop1，prop2, prop3. 并计算两者的差值diff1=prop2-prop1 和diff2=prop3-prop1（最后列名字不能错，顺序也不能错，dest,prop1,prop2,prop3,diff1,diff2)

时间: 2023-09-17 13:14:22 浏览: 39

以下是代码实现： ```r library(dplyr) flights %>% filter(!is.na(dest)) %>% group_by(dest) %>% summarize(prop1 = mean(arr_delay > 0), prop2 = mean(arr_delay > 0, na.rm = TRUE), prop3 = mean(arr_delay > 0, na.rm = sum(!is.na(arr_delay))/2)) %>% arrange(dest) %>% mutate(diff1 = prop2 - prop1, diff2 = prop3 - prop1) ``` 解释一下代码： - 首先使用 `filter(!is.na(dest))` 去除 `dest` 列中的 `NA` 值。 - 然后使用 `group_by(dest)` 按 `dest` 分组。 - 使用 `summarize()` 函数计算每组的三种情况下的比例，分别命名为 `prop1`、`prop2`、`prop3`。 - 使用 `arrange(dest)` 按 `dest` 字母顺序排序。 - 最后使用 `mutate()` 函数计算 `diff1` 和 `diff2` 两列，分别为 `prop2-prop1` 和 `prop3-prop1`。

在flights中，#按dest分组，考虑arr_delay列，去除两列中NA值。将dest按字母顺序，由小至大。新增列rank1，为数据表该行在对应的dest小组中的rank(针对arr_delay列，不用summarise做），新增列rank2，为数据表该行在对应的dest小组中的rank逆排序rank(desc), 新增列diff，为逻辑变量如果rank1>rank2结果为true，否则false。最终结果4列。dest,rank1,rank2,diff。注意题目说rank就用rank命令，如说min_rank就用min_rank命令

以下是可以实现这个功能的代码： ```{r} library(dplyr) flights %>% filter(!is.na(arr_delay)) %>% # 去除NA值 group_by(dest) %>% arrange(dest, arr_delay) %>% # 按字母顺序，arr_delay升序排序 mutate(rank1 = rank(arr_delay), # 计算rank1 rank2 = rank(desc(arr_delay)), # 计算rank2 diff = rank1 > rank2) %>% # 计算diff select(dest, rank1, rank2, diff) # 选择需要的列 ``` 解释一下代码：首先用`filter()`函数去除了`arr_delay`列中的NA值。然后用`group_by(dest)`函数按`dest`列进行分组。接着用`arrange(dest, arr_delay)`函数按字母顺序和`arr_delay`升序排序。然后用`mutate()`函数新增了三列，分别是`rank1`、`rank2`和`diff`。其中`rank1`是`arr_delay`列在对应的`dest`小组中的排名，使用`rank()`函数计算。`rank2`是`arr_delay`列在对应的`dest`小组中的逆序排名，使用`rank(desc(arr_delay))`函数计算。`diff`是逻辑变量，如果`rank1`大于`rank2`则为TRUE，否则为FALSE。最后用`select()`函数选择需要的列，包括`dest`、`rank1`、`rank2`和`diff`。

用r语言完成，在flights中，按dest分组，考虑arr_delay列，去除dest列中NA值。将dest按字母顺序，由小至大，求每组中arr_delay>0的比例，分三种情况,不去除NA值，去除NA值，NA值的个数只按50%计算。如（1，2，-1，NA，NA）计算结果0.4， 0.666，0.5. 三列的名字为prop1，prop2, prop3. 并计算两者的差值diff1=prop2-prop1 和diff2=prop3-prop1（最后列名字不能错，顺序也不能错，dest,prop1,prop2,prop3,diff1,diff2)要求tibble中不含NA值

以下是代码实现： ```r library(dplyr) flights %>% filter(!is.na(dest)) %>% group_by(dest) %>% summarize(prop1 = mean(arr_delay > 0), prop2 = mean(arr_delay > 0, na.rm = TRUE), prop3 = mean(arr_delay > 0, na.rm = sum(!is.na(arr_delay))/2)) %>% arrange(dest) %>% mutate(diff1 = prop2 - prop1, diff2 = prop3 - prop1) %>% select(dest, prop1, prop2, prop3, diff1, diff2) ``` 首先使用`filter`函数去除`dest`列中的NA值，然后使用`group_by`函数按照`dest`分组，再使用`summarize`函数计算每组中`arr_delay>0`的比例，分别对应于`prop1`、`prop2`和`prop3`。其中，`prop1`不去除NA值，`prop2`去除NA值，`prop3`将NA值按照50%计算。最后使用`arrange`函数将`dest`按照字母顺序排序，再使用`mutate`函数计算出`diff1`和`diff2`，最后使用`select`函数选择需要输出的列。

相关推荐

OpenDDS-latest.rar_cannot8k1_flights8y_openDDS开发_opendds中文教程_ope

flights_flights_flights.json_echarts_

IBCellFlipSegue:IBCellFlipSegue是一个简单的自定义设置，旨在在新版本的Expedia Hotels＆Flights应用中复制按钮的行为

r语言dddddddddddd

flights:在 Rails 中处理飞行端点..

spring-flights：演示应用程序在Spring中展示了RSocket支持

US_Domestic_Flights_OnTime_Performance_Analysis

jetblue-flights:一个使用jetblue_plane_tracker gem的简单Rails应用

multisim仿真电路实例700例.rar

2007-2021年 企业数字化转型测算结果和无形资产明细

最新推荐

multisim仿真电路实例700例.rar

数据结构课程设计：模块化比较多种排序算法

管理建模和仿真的文件

STM32单片机小车智能巡逻车设计与实现：打造智能巡逻车，开启小车新时代

devc++如何监视

哈夫曼树实现文件压缩解压程序分析

"互动学习：行动中的多样性与论文攻读经历"

STM32单片机小车硬件优化策略：优化硬件设计，让小车更稳定更可靠

android studio购物车源码

数据结构课程设计：电梯模拟与程序实现

2007-2021年企业数字化转型测算结果和无形资产明细