优化data("airquality") solar.R <- airquality$Solar.R Solar.R1 <- rep(0,length(solar.R)) for (i in 1:length(Solar.R1)) { Solar.R2 <- Solar.R[i:(i-1)] if(!is.na(solar.R[i])){ Solar.R1[i] <- solar.R[i] }else{ Solar.R1[i] <- mean(solar.R[is.na(solar.R[1:(i-1)])]) } }
时间: 2023-04-12 11:01:45 浏览: 128
这段代码的作用是将 airquality 数据集中的 Solar.R 列中的缺失值替换为前面所有非缺失值的平均值,并将结果存储在 Solar.R1 中。优化的方法可以是使用 apply 函数代替 for 循环,如下所示:
Solar.R1 <- apply(X = airquality$Solar.R, MARGIN = 1, FUN = function(x) {
x[is.na(x)] <- mean(x, na.rm = TRUE)
return(x)
})
相关问题
r语言data.table创建原始 airquality 数据的子集
可以使用以下代码来创建 airquality 数据的子集:
```
library(data.table)
data(airquality)
airquality.dt <- data.table(airquality)
subset <- airquality.dt[Ozone > 31 & Month == 5, .(Ozone, Solar.R)]
```
这将创建一个包含所有五月份 Ozone 值大于 31 的行以及对应的 Solar.R 值的数据表子集。
R语言airquality
`airquality` 是一个 R 语言中自带的数据集,它记录了纽约市在 1973 年 5 月至 9 月期间每天的空气质量指标。这个数据集包含了五个变量:
- Ozone:臭氧浓度(ppb)
- Solar.R:太阳辐射量(lang)
- Wind:风速(mph)
- Temp:气温(华氏度)
- Month:月份(5-9)
你可以使用以下代码来加载这个数据集:
```r
data(airquality)
```
然后可以使用 `summary()` 函数来查看数据集的概要信息:
```r
summary(airquality)
```
这个函数会输出各个变量的一些统计信息,如最小值、最大值、中位数、平均数等等。你也可以使用其他函数来对数据进行分析和可视化。
阅读全文