函数train_test_split
时间: 2023-09-07 12:17:48 浏览: 78
一个线性回归模型实例,我们使用train-test-split函数将数据集拆分为训练集和测试集
train_test_split是sklearn库中用于将数据集分成训练集和测试集的函数。它的作用是将一个数据集随机分成训练集和测试集两部分,以便我们可以用训练集训练模型,用测试集测试模型的泛化能力。
该函数的基本用法是:train_test_split(X, y, test_size, random_state)。其中,X是特征矩阵,y是目标变量,test_size是测试集所占比例,random_state是随机数种子。
例如,以下代码将数据集分成训练集和测试集,其中测试集所占比例为0.3:
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
其中,X_train和y_train是训练集的特征矩阵和目标变量,X_test和y_test是测试集的特征矩阵和目标变量。
阅读全文