sample.split
时间: 2023-11-08 14:01:35 浏览: 108
sample.split是一个在R语言中常用的函数,用于将数据集分为训练集和测试集。它可以根据指定的比例或样本数将数据集划分为两部分。
使用sample.split函数的基本语法如下:
```
sample.split(data, SplitRatio, Seed)
```
其中,data是要进行划分的数据集,SplitRatio是训练集所占的比例(0-1之间),Seed是随机数生成器的种子(可选参数)。
这个函数的返回值是一个逻辑向量,长度与输入数据集相等。它将根据SplitRatio的比例为每个样本生成TRUE或FALSE的值,表示该样本属于训练集(TRUE)或测试集(FALSE)。
以下是一个示例:
```R
# 加载需要划分的数据集
library(caTools)
data(iris)
# 将数据集划分为训练集和测试集,比例为0.7
split <- sample.split(iris$Species, SplitRatio = 0.7)
# 根据划分结果获取训练集和测试集
train <- subset(iris, split == TRUE)
test <- subset(iris, split == FALSE)
# 输出训练集和测试集的行数
nrow(train)
nrow(test)
```
这样就可以将数据集iris按照0.7的比例划分为训练集和测试集。
阅读全文