x_train, x_test, y_train, y_test = train_test_split(data, target, test_size=0.2,random_state=0)
时间: 2023-07-20 16:16:33 浏览: 131
`train_test_split()` 是一个用于将数据集拆分成训练集和测试集的函数。具体来说,它可以将输入的数据集 `data` 和目标标签 `target` 按照给定的比例(例如 80/20)拆分成训练集和测试集,其中训练集用于训练模型,测试集用于评估模型的性能。
在这个例子中,我们使用了 `train_test_split()` 函数将数据集 `data` 和目标标签 `target` 拆分成了训练集 `x_train` 和 `y_train`,以及测试集 `x_test` 和 `y_test`。具体来说,我们将数据集和目标标签传入 `train_test_split()` 函数,设置测试集所占比例为 20%,并指定了一个随机数种子 `random_state=0`。这样,我们就可以通过访问 `x_train`、`y_train`、`x_test` 和 `y_test`,来访问拆分后的训练集和测试集。
具体的代码实现如下:
```python
from sklearn.model_selection import train_test_split
# 将数据集拆分成训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(data, target, test_size=0.2, random_state=0)
```
在这个例子中,我们使用了 Scikit-learn 中的 `train_test_split()` 函数,将数据集和目标标签拆分成了训练集和测试集,并分别保存到 `x_train`、`y_train`、`x_test` 和 `y_test` 中。这样,我们就可以使用这些数据来训练和测试我们的机器学习模型。
阅读全文