library(dplyr) set.seed(33) train_X <- select(train, -c(Salary, log_Salary)) ctrl <- trainControl(method = "repeatedcv", number = 5, repeats = 3, verboseIter = F) model_bagging <- train(y = train$log_Salary, x = train_X, method = "rf", metric = "MSE", maximize = F, trControl = ctrl, tuneGrid = expand.grid(mtry = 19))
时间: 2023-06-11 18:08:15 浏览: 181
机器学习数据包.rar
这段代码使用了dplyr和caret两个R语言中的包,用于数据处理和机器学习模型的训练。这里使用了train函数,采用了随机森林(random forest)的方法,用于预测Salary的对数值。trainControl函数用于设置交叉验证的参数,method参数设置为"repeatedcv"表示采用重复交叉验证的方法,number参数表示将数据分为5份,repeats参数表示重复运行3次以减小偶然性,verboseIter参数表示关闭交叉验证过程中的输出。tuneGrid参数用于设置随机森林中的参数mtry(每个决策树中随机选择的特征数),这里设置为19。
阅读全文