sklearn.model_selection.train_test_split 用法
时间: 2023-10-10 22:09:44 浏览: 180
基于sklearn的logistic回归对于鸢尾花的机器学习分类实践
5星 · 资源好评率100%
sklearn.model_selection.train_test_split 是 scikit-learn 库中的一个函数,用于将数据集划分为训练集和测试集。它的用法如下:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
这里的 `X` 是特征矩阵,`y` 是目标变量的向量。`test_size` 参数表示测试集所占总体数据的比例,可以是一个介于 0 到 1 之间的浮点数,也可以是一个整数表示具体的样本数量。`random_state` 参数用于设置随机种子,以确保每次划分的结果一致。
通过调用该函数,会将数据集按照指定的比例或数量进行划分,并返回四个结果:`X_train`、`X_test`、`y_train`、`y_test`。其中,`X_train` 和 `y_train` 是训练集的特征矩阵和目标变量,`X_test` 和 `y_test` 是测试集的特征矩阵和目标变量。
你可以使用这些划分后的数据集来训练和评估机器学习模型。
阅读全文