说明并举例一下train_test_split函数
时间: 2023-10-19 21:24:32 浏览: 69
一个线性回归模型实例,我们使用train-test-split函数将数据集拆分为训练集和测试集
train_test_split函数是Scikit-learn库中的一个函数,用于将数据集按照一定比例随机分为训练集和测试集。该函数常用于机器学习任务中,用于训练模型和测试模型的性能。
train_test_split函数的参数包括原始数据集、测试集比例、随机数种子等。其返回值为四个数组,分别为训练集特征、测试集特征、训练集标签、测试集标签。
以下是train_test_split函数的示例代码:
```python
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
iris = load_iris() # 载入鸢尾花数据集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42) # 将数据集分为训练集和测试集,测试集占30%
print(X_train.shape, y_train.shape) # 输出训练集特征和标签的形状
print(X_test.shape, y_test.shape) # 输出测试集特征和标签的形状
```
运行以上代码,可以看到训练集特征和标签的形状为(105, 4)和(105,),测试集特征和标签的形状为(45, 4)和(45,),符合比例要求。
阅读全文