r代码如何划分训练集验证集和测试集
时间: 2023-09-05 08:13:23 浏览: 118
python 划分数据集为训练集和测试集的方法
可以使用以下代码将数据集随机划分为训练集、验证集和测试集:
```r
library(caret)
# 读入数据集
data <- read.csv("data.csv")
# 设置随机数种子,确保每次划分结果一致
set.seed(123)
# 划分数据集,trainRatio为训练集比例,validRatio为验证集比例,测试集比例为1-trainRatio-validRatio
index <- createDataPartition(data$label, p = 0.8, list = FALSE, times = 1)
trainData <- data[index,]
testData <- data[-index,]
index2 <- createDataPartition(trainData$label, p = 0.75, list = FALSE, times = 1)
trainIndex <- index2
validIndex <- -index2
trainData <- trainData[trainIndex,]
validData <- trainData[validIndex,]
```
这里使用了`caret`包中的`createDataPartition()`函数随机划分数据集,其中`p`参数为训练集比例,`list`参数表示是否以列表形式返回索引,`times`参数表示重复划分的次数。最后,将数据集根据索引划分为训练集、验证集和测试集。
阅读全文