train_test_split用法
时间: 2024-04-11 16:25:35 浏览: 158
数据集分割train和test程序
train_test_split是一个常用的函数,用于将数据集划分为训练集和测试集。它的主要作用是帮助我们评估机器学习模型的性能。
train_test_split函数的用法如下:
```
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X是特征矩阵,y是目标变量。test_size参数指定了测试集的比例,可以是一个小数(表示比例)或一个整数(表示样本数量)。random_state参数用于设置随机种子,保证每次划分的结果一致。
函数的返回值是划分后的训练集和测试集的特征矩阵和目标变量。通常,我们将特征矩阵记为X,目标变量记为y。
阅读全文