首页sample.split

sample.split

时间: 2023-11-08 14:01:35 浏览: 108

sample.split是一个在R语言中常用的函数，用于将数据集分为训练集和测试集。它可以根据指定的比例或样本数将数据集划分为两部分。使用sample.split函数的基本语法如下： ``` sample.split(data, SplitRatio, Seed) ``` 其中，data是要进行划分的数据集，SplitRatio是训练集所占的比例（0-1之间），Seed是随机数生成器的种子（可选参数）。这个函数的返回值是一个逻辑向量，长度与输入数据集相等。它将根据SplitRatio的比例为每个样本生成TRUE或FALSE的值，表示该样本属于训练集（TRUE）或测试集（FALSE）。以下是一个示例： ```R # 加载需要划分的数据集 library(caTools) data(iris) # 将数据集划分为训练集和测试集，比例为0.7 split <- sample.split(iris$Species, SplitRatio = 0.7) # 根据划分结果获取训练集和测试集 train <- subset(iris, split == TRUE) test <- subset(iris, split == FALSE) # 输出训练集和测试集的行数 nrow(train) nrow(test) ``` 这样就可以将数据集iris按照0.7的比例划分为训练集和测试集。

阅读全文