train_test_split是什么
时间: 2023-10-13 17:23:31 浏览: 75
数据集分割train和test程序
`train_test_split`是机器学习中常用的一个函数,用于将数据集分成训练集和测试集。训练集通常用于训练模型,而测试集则用于评估模型在未见过的数据上的性能。
该函数的基本用法为:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中`X`是特征矩阵,`y`是目标向量,`test_size`表示测试集所占的比例,`random_state`用于设置随机种子,以便结果可复现。该函数会返回四个变量,分别是划分好的训练集和测试集的特征矩阵和目标向量。
阅读全文