R语言将数据拆分为测试集和训练集的代码
时间: 2023-09-24 12:06:03 浏览: 141
爬虫代码,数据集寻找加自动分类,训练集,测试集自动生成!下载就可用,python
在R语言中,可以使用 `caret` 包中的 `createDataPartition()` 函数将数据集拆分为训练集和测试集。
示例代码如下:
```r
# 加载 caret 包
library(caret)
# 设置随机数种子,保证结果可复现
set.seed(123)
# 加载数据集
data(iris)
# 将数据集拆分为训练集(70%)和测试集(30%)
train_index <- createDataPartition(iris$Species, p = 0.7, list = FALSE)
train_data <- iris[train_index, ]
test_data <- iris[-train_index, ]
```
在上面的代码中,我们将鸢尾花数据集 `iris` 拆分为了训练集 `train_data` 和测试集 `test_data`,其中训练集占总数据集的 70%。函数 `createDataPartition()` 的第一个参数为目标变量,第二个参数是训练集所占比例,第三个参数 `list` 设置为 FALSE 表示返回的是数据集的行索引,否则返回一个包含训练集和测试集行索引的列表。
阅读全文