划分训练集和测试集的python代码
时间: 2023-05-24 20:06:54 浏览: 109
划分训练集和测试集 示例代码 python
以下是使用sklearn库中train_test_split方法划分训练集和测试集的Python代码:
```
from sklearn.model_selection import train_test_split
#加载数据集,X为数据特征,y为数据标签
X, y = load_data()
#划分数据集,test_size为测试集占总数据的比例
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
```
其中,`X`为数据的特征,`y`为数据的标签,`test_size`表示测试集占总数据集的比例(例如`test_size=0.2`表示使用20%的数据作为测试集),`random_state`用于设定随机种子,保证每次随机划分的结果一致。 `train_test_split`方法会返回4个数组:`X_train`为训练集的特征数据,`y_train`为训练集的标签数据,`X_test`为测试集的特征数据,`y_test`为训练集的标签数据。
阅读全文