首页predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择

predict函数 R_R包randomForest的随机森林回归模型以及对重要变量的选择

时间: 2024-03-17 20:47:35 浏览: 15

R语言中，randomForest包提供了随机森林回归模型的函数randomForest()，可以用于建立随机森林回归模型。predict()函数可以用于对新数据进行预测。以下是一个使用randomForest包建立随机森林回归模型的示例： ```R # 加载randomForest包 library(randomForest) # 读取数据 data(iris) # 随机抽样80%的数据作为训练集 trainIndex <- sample(1:nrow(iris), 0.8*nrow(iris)) trainData <- iris[trainIndex, ] testData <- iris[-trainIndex, ] # 建立随机森林回归模型 rfModel <- randomForest(Sepal.Length ~ ., data=trainData, ntree=500) # 对测试集进行预测 rfPred <- predict(rfModel, testData) # 输出预测结果 print(rfPred) ``` 对于重要变量的选择，可以使用randomForest包中的importance()函数来计算每个变量的重要性，然后选择重要性较高的变量。以下是一个示例： ```R # 计算每个变量的重要性 rfImp <- importance(rfModel) # 输出每个变量的重要性 print(rfImp) # 选择重要性较高的变量 importantVars <- names(rfImp)[rfImp["MeanDecreaseAccuracy"] > mean(rfImp["MeanDecreaseAccuracy"])] # 输出重要性较高的变量 print(importantVars) ``` 以上就是使用R语言中的randomForest包建立随机森林回归模型，并选择重要变量的方法。