predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择
时间: 2024-03-10 09:47:46 浏览: 90
用R实现随机森林的分类与回归
R语言中,使用randomForest包中的randomForest函数可以建立随机森林回归模型。该函数的主要参数有:
- x:自变量矩阵或数据框。
- y:因变量向量。
- ntree:随机森林中树的数量,默认为500。
- mtry:每次分裂时随机选择的变量数量,默认为sqrt(p)。
- importance:是否计算变量的重要性指标,默认为TRUE。
下面是一个示例代码:
```r
library(randomForest)
data(mtcars)
rf_model <- randomForest(mpg ~ ., data = mtcars, ntree = 1000, mtry = 3, importance = TRUE)
```
在建立好随机森林回归模型之后,我们可以使用importance函数来查看变量的重要性指标:
```r
varImpPlot(rf_model)
```
该函数会生成一个变量重要性图,可以看到每个变量的重要性得分以及排名。需要注意的是,变量的重要性得分越高,则该变量对模型的贡献越大。
此外,我们还可以使用predict函数对新数据进行预测:
```r
new_data <- data.frame(cyl = 6, disp = 200, hp = 100, drat = 3.9, wt = 3, qsec = 17)
predict(rf_model, newdata = new_data)
```
这段代码可以对新数据进行预测,输出的结果是对应的mpg预测值。
阅读全文