python 将训练集划分为训练数据和训练标签
时间: 2023-12-14 22:36:43 浏览: 104
机器学习-车牌训练数据集
在Python中,可以使用scikit-learn库中的train_test_split方法将训练集划分为训练数据和训练标签。train_test_split方法可以随机地将数据集划分为训练集和测试集,并且可以指定划分的比例。
以下是一个示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设X是训练数据,y是训练标签
X = [[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]
y = [0, 1, 2, 3, 4]
# 将数据集划分为训练集和测试集,测试集占比为0.2
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 输出训练集和训练标签
print("训练数据:", X_train)
print("训练标签:", y_train)
```
输出结果为:
```
训练数据: [[4, 5], [6, 7], [0, 1], [8, 9]]
训练标签: [2, 3, 0, 4]
```
在这个例子中,训练数据X被划分为训练集X_train和测试集X_test,对应的训练标签y也被划分为训练集y_train和测试集y_test。其中,测试集占比为0.2,random_state为随机数种子,用于保证每次运行结果相同。
阅读全文