predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择
时间: 2024-03-17 20:47:35 浏览: 15
R语言中,randomForest包提供了随机森林回归模型的函数randomForest(),可以用于建立随机森林回归模型。predict()函数可以用于对新数据进行预测。
以下是一个使用randomForest包建立随机森林回归模型的示例:
```R
# 加载randomForest包
library(randomForest)
# 读取数据
data(iris)
# 随机抽样80%的数据作为训练集
trainIndex <- sample(1:nrow(iris), 0.8*nrow(iris))
trainData <- iris[trainIndex, ]
testData <- iris[-trainIndex, ]
# 建立随机森林回归模型
rfModel <- randomForest(Sepal.Length ~ ., data=trainData, ntree=500)
# 对测试集进行预测
rfPred <- predict(rfModel, testData)
# 输出预测结果
print(rfPred)
```
对于重要变量的选择,可以使用randomForest包中的importance()函数来计算每个变量的重要性,然后选择重要性较高的变量。以下是一个示例:
```R
# 计算每个变量的重要性
rfImp <- importance(rfModel)
# 输出每个变量的重要性
print(rfImp)
# 选择重要性较高的变量
importantVars <- names(rfImp)[rfImp["MeanDecreaseAccuracy"] > mean(rfImp["MeanDecreaseAccuracy"])]
# 输出重要性较高的变量
print(importantVars)
```
以上就是使用R语言中的randomForest包建立随机森林回归模型,并选择重要变量的方法。