createDataPartition在R语言下怎么使用?
时间: 2024-05-01 09:23:42 浏览: 487
`createDataPartition`是`caret`包中的一个函数,用于创建数据集的分割,比如将数据集分为训练集和测试集。在使用该函数前需要先安装`caret`包。
以下是一个使用`createDataPartition`函数创建训练集和测试集的示例代码:
```R
# 加载caret包
library(caret)
# 加载数据集,这里以iris数据集为例
data(iris)
# 将数据集分为训练集和测试集,其中train_size表示训练集所占比例
# 设置seed可以保证每次运行结果一致
index <- createDataPartition(y = iris$Species, p = 0.7, list = FALSE, times = 1, groups = NULL,
# 设置seed
verbose = FALSE,
# 设置为FALSE则返回行号,TRUE则返回布尔型矩阵
returnResamp = "boot",
# 设置为TRUE则允许不均衡抽样
strata = iris$Species)
# 根据分割结果创建训练集和测试集
train_data <- iris[index,]
test_data <- iris[-index,]
# 查看训练集和测试集的大小
nrow(train_data) # 训练集大小
nrow(test_data) # 测试集大小
```
在上面的代码中,`y`参数表示要分割的数据集的标签列,`p`参数表示训练集所占比例,`list`参数表示是否返回列表类型的结果等等。最后根据分割结果创建训练集和测试集即可。
阅读全文