2. 本题使用数据集 nycflights13::flights （1）请首先剔除数据中实际出发时间ሺdep_timeሻ缺失的观测值，然后生成一个新的变量 dep_interval，用来将数据中的实际出发时间分为上午ሺ6:01‐ 12:00ሻ、下午ሺ12:01‐18:00ሻ、晚上ሺ18:01‐24:00ሻ和凌晨ሺ0:01‐6:00ሻ四组，将每一年每一月每一天内每个 dep_interval 分组（year, month, day, dep_interval），计算每一组的平均到达延误时间和到达延误的方差，以及到达的机场数量（注意：相同机场不能重复计算）（20’）（2）选取平均到达延误在 30 分钟以内同时平均到达机场数据不低于 50 个的小组，并按照平均到达延误由大到小排列（5’）

时间: 2024-03-07 19:49:53 浏览: 25

很抱歉，作为一个语言模型，我无法直接使用R语言进行数据处理和计算。但我可以提供一些思路和方法供你参考： 1. 首先，使用R语言读取数据集 nycflights13::flights，然后剔除实际出发时间（dep_time）缺失的观测值，可以使用na.omit函数实现。 2. 接下来，可以创建一个新变量dep_interval，使用ifelse函数将实际出发时间分为四组：上午、下午、晚上和凌晨。例如： ``` flights$dep_interval <- ifelse(flights$dep_time >= 601 & flights$dep_time <= 1200, "上午", ifelse(flights$dep_time > 1200 & flights$dep_time <= 1800, "下午", ifelse(flights$dep_time > 1800 & flights$dep_time <= 2400, "晚上", ifelse(flights$dep_time > 1 & flights$dep_time <= 600, "凌晨", NA)))) ``` 注意，这里使用了嵌套的ifelse函数，对于不满足条件的时间值，赋值为NA。 3. 然后，根据年、月、日和dep_interval进行分组，计算每组的平均到达延误时间、到达延误方差和到达机场数量。可以使用dplyr包中的group_by和summarize函数实现。 ``` library(dplyr) flights_new <- flights %>% na.omit() %>% group_by(year, month, day, dep_interval) %>% summarize(mean_arr_delay = mean(arr_delay, na.rm = TRUE), var_arr_delay = var(arr_delay, na.rm = TRUE), num_airports = n_distinct(arrival)) ``` 注意，这里使用了na.rm参数删除缺失值，并使用n_distinct函数计算到达机场数量。 4. 最后，选取平均到达延误在30分钟以内且平均到达机场数据不低于50个的小组，并按照平均到达延误由大到小排列。可以使用filter和arrange函数实现。 ``` flights_select <- flights_new %>% filter(mean_arr_delay <= 30, num_airports >= 50) %>% arrange(desc(mean_arr_delay)) ``` 注意，这里使用了desc函数将结果按照平均到达延误由大到小排列。希望这些思路和方法可以帮助你完成题目要求。

相关推荐

航空公司数据集_Flight#2_flight_航空公司数据集_

Flights & Tickets 航班机票数据集.7z

anyflights:R包可生成类似nycflights13的航空旅行数据:small_airplane:

利用r语言帮我写一段代码，使它可以剔除数据集nycflights13：：flights中实际出发时间（dep_time）缺失的观测值

根据nycflights13::flights中的dep_time和arr_time计算出出发和到达时刻（精确到分）。dep_time和arr_time都是整数型的列，数值格式是HHMM或HMM.

利用数据包 nycflights13: 1. 利用 flights 和 planes，找到平均服役时间最长前十种型号（model）的飞机

确定nycflights13::flights 数据集中每列的类型

flights 数据中筛选出出发时间延误 1 小时或更多的航班，并将生成的新数 据保存为 flights_dep1hr

在r语言的flights中完成：去掉 flights 表中 dep_delay 为缺失值的行后，计算出发日期为 1 月的航班中出发延 误(dep_delay > 0)的比例是多少(保留小数点后三位)

数据: nycflights13, 如果没有请先安装包(nycflights13)|

修改这段代码解决其中dep_time_ 与dep_time日期不一致的问题：flights_dt %>% mutate(dep_time_ = sched_dep_time + dep_delay * 60) %>% filter(dep_time_ != dep_time) %>% select(dep_time_, dep_time, sched_dep_time, dep_delay)

.去掉 flights 表中 dep_delay 为缺失值的行后，计算出发日期为 1 月的航班中出发延 误(dep_delay > 0)的比例是(保留小数点后三位)________。

使用C#爬取https://flights.sda.cn/flight/search/tna-xmn-230717-1页面数据

去掉flights表中dep_delay为缺失值的行后，计算出发日期为1月的航班中出发延误(dep_delay > 0)的比例是(保留小数点后三位)

1.数据：nycflights13，如果没有请先安装包(nyctights13 (1) 将flights 和 planes 进行连接，其中，最终结果应当保存 flights 中的所有观测值并且保存 planes 中对应的观测值，并将结果命名为flights_planes

1、从flights数据中找到到达时间延误两小时或更多的所有航班，并将生成的新数据集保存为flights_arr2hr

使用r语言：7.flights 表中出发日期为星期一的航班有________条记录。(5 分)

最新推荐

智能制造的数字化工厂规划qytp.pptx

罗兰贝格：德隆人力资源管理体系gltp.pptx

JAVA3D的网络三维技术的设计与实现.zip

setuptools-11.3.1.tar.gz

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

解释minorization-maximization (MM) algorithm，并给出matlab代码编写的例子

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

flights 数据中筛选出出发时间延误 1 小时或更多的航班，并将生成的新数据保存为 flights_dep1hr

在r语言的flights中完成：去掉 flights 表中 dep_delay 为缺失值的行后，计算出发日期为 1 月的航班中出发延误(dep_delay > 0)的比例是多少(保留小数点后三位)

.去掉 flights 表中 dep_delay 为缺失值的行后，计算出发日期为 1 月的航班中出发延误(dep_delay > 0)的比例是(保留小数点后三位)________。