train_set, test_set = train_test_split函数如何运用
时间: 2023-10-13 19:09:27 浏览: 90
一个线性回归模型实例,我们使用train-test-split函数将数据集拆分为训练集和测试集
train_test_split函数是用于将数据集划分为训练集和测试集的函数。该函数的作用是将原始数据集按照一定比例划分为两个部分,一部分作为训练集,用于训练模型;另一部分作为测试集,用于评估模型的性能。
train_test_split函数的使用方法如下:
```python
from sklearn.model_selection import train_test_split
# X为特征数据集,y为标签数据集,test_size为测试集占比,random_state为随机种子
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
其中,参数说明如下:
- X: 特征数据集
- y: 标签数据集
- test_size: 测试集占比,默认为0.25
- random_state: 随机种子,用于保证每次随机划分的结果一致
该函数会返回4个数据集,即训练集特征数据集(X_train)、测试集特征数据集(X_test)、训练集标签数据集(y_train)、测试集标签数据集(y_test)。使用这些数据集可以进行模型的训练和评估。
阅读全文