1.本题使用数据包 nycflights13 (24 分) (1)从flights 数据表中挑选出以下变量: (year, month,day, hour, origin, dep delay, distance,carrier),将生产的新表保存为 flight1。 (2)从weather 数据表中挑选出以下变量: (year, month, day, hour,origin, humid, wind speed),将生产的新表保存为 weather1。 (3)将 flight1 表和 weather1 表根据共同变量进行内连接,随机抽取 100000 行数据,将生产的结果保存为 flight weather。(提示: sample nO函数,不用重复抽取) (4) 从 flight weather 表中对三人出发机场按照平均出发延误时间排降序,并将结果保留在longest delay 表中。把结果展示出来。 (5) 根据出发地 (origin) 在同一个图中画出风速 wind speed (x轴)和出发延误时间 dep delay (y轴) 的平滑曲线图。 (6)根据不同出发地(origin) 在平行的3个图中画出风速 wind speed(x 轴)和出发延误时间 dep delay(y轴) 的散点图。 (7) 根据 flight weather 表,画出每个月航班数的直方分布图,x轴为月份,y轴是每个月份航班数所占的比例。 (8) 根据 flight weather 表,画出每个月航班距离的 boxplot 图,x 轴为月份,y轴为航行距离,根据的航行距离的中位数从低到高对 x 轴的月份进行重新排序。 r语言
时间: 2024-03-13 22:47:28 浏览: 73
anyflights:R包可生成类似nycflights13的航空旅行数据:small_airplane:
很抱歉,我作为一个人工智能无法直接处理文字命令,但我可以根据你的问题提供一些帮助和指导。
针对你的问题,需要使用 R 语言对 nycflights13 数据包进行操作和处理。可以按照以下步骤进行操作:
1. 使用以下命令加载数据包:
```
library(nycflights13)
```
2. 使用以下命令从 flights 数据表中挑选出需要的变量,并将结果保存为 flight1 表:
```
flight1 <- flights[, c("year", "month", "day", "hour", "origin", "dep_delay", "distance", "carrier")]
```
3. 使用以下命令从 weather 数据表中挑选出需要的变量,并将结果保存为 weather1 表:
```
weather1 <- weather[, c("year", "month", "day", "hour", "origin", "humid", "wind_speed")]
```
4. 使用以下命令将 flight1 表和 weather1 表根据共同变量进行内连接,并随机抽取 100000 行数据,将结果保存为 flight_weather 表:
```
flight_weather <- merge(flight1, weather1, by = c("year", "month", "day", "hour", "origin"))
flight_weather <- flight_weather[sample(nrow(flight_weather), 100000), ]
```
5. 使用以下命令对三个出发机场按照平均出发延误时间进行降序排列,并将结果保存在 longest_delay 表中:
```
longest_delay <- aggregate(dep_delay ~ origin, data = flight_weather, FUN = mean)
longest_delay <- longest_delay[order(longest_delay$dep_delay, decreasing = TRUE), ]
```
6. 使用以下命令根据出发地在同一个图中画出风速和出发延误时间的平滑曲线图:
```
library(ggplot2)
ggplot(flight_weather, aes(x = wind_speed, y = dep_delay, color = origin)) + geom_smooth()
```
7. 使用以下命令根据不同出发地在平行的三个图中画出风速和出发延误时间的散点图:
```
ggplot(flight_weather, aes(x = wind_speed, y = dep_delay)) +
geom_point() +
facet_wrap(~ origin)
```
8. 使用以下命令根据 flight_weather 表画出每个月航班数的直方分布图:
```
ggplot(flight_weather, aes(x = month)) +
geom_histogram(aes(y = ..density..), binwidth = 1) +
scale_y_continuous(labels = scales::percent_format()) +
labs(x = "Month", y = "Percentage of flights")
```
9. 使用以下命令根据 flight_weather 表画出每个月航班距离的 boxplot 图:
```
ggplot(flight_weather, aes(x = factor(month, levels = unique(month)[order(tapply(distance, month, median))]), y = distance)) +
geom_boxplot() +
labs(x = "Month", y = "Distance")
```
阅读全文