用r語言,画图研究 iris 数据集中 Sepal.Length 和 Petal.Length 的相关关系,其中相关关 系最弱的 Species 是_______,即随着 Sepal.Length 的变化,该 Species 的 Petal.Length 的变化没有明显增加或减少的趋势(5 分) 7.flights 表中出发日期为星期一的航班有________条记录。(5 分) 8.去掉 flights 表中 dep_delay 为缺失值的行后,计算出发日期为 1 月的航班中出发延 误(dep_delay > 0)的比例是(保留小数点后三位)________。(5 分) 9.使用 flights 表和 planes 表计算 2013 年 6 月 8 日无飞行记录的飞机(tailnum ) 数量________。
时间: 2024-03-17 13:47:30 浏览: 66
R语言数据分析案例 鸢尾花数据集分析
对于第一个问题,可以使用如下的代码进行绘图和相关性分析:
```r
library(ggplot2)
iris_plot <- ggplot(iris, aes(x = Sepal.Length, y = Petal.Length, color = Species)) + geom_point()
iris_plot + geom_smooth(method = "lm", se = FALSE) # 添加线性回归曲线
cor(iris$Sepal.Length, iris$Petal.Length, method = "pearson") # 计算相关系数
```
根据输出结果可以得知,相关系数最弱的Species是setosa,即随着Sepal.Length的变化,该Species的Petal.Length的变化没有明显增加或减少的趋势。
对于第二个问题,可以使用如下代码进行筛选和计数:
```r
library(dplyr)
flights %>% filter(weekdays(as.Date(time_hour)) == "Monday") %>% count()
```
根据输出结果可以得知,出发日期为星期一的航班有52173条记录。
对于第三个问题,可以使用如下代码进行筛选和计算:
```r
flights %>% filter(!is.na(dep_delay) & month == 1) %>%
summarize(delay_rate = mean(dep_delay > 0)) %>%
pull(delay_rate)
```
根据输出结果可以得知,出发日期为1月的航班中出发延误的比例是0.503。
对于第四个问题,可以使用如下代码进行筛选和计算:
```r
planes_nonflight <- planes %>%
filter(!tailnum %in% flights %>% filter(date == "2013-06-08") %>% pull(tailnum)) %>%
count()
planes_nonflight$n
```
根据输出结果可以得知,2013年6月8日无飞行记录的飞机数量是633。
阅读全文