train_test_split 均匀划分
时间: 2024-04-04 11:27:07 浏览: 103
create_balanced_train_test.zip_The Divide
train_test_split是一个常用的函数,用于将数据集划分为训练集和测试集。均匀划分是指将数据集按照一定比例随机划分为训练集和测试集,保持类别分布的一致性。
train_test_split函数的使用方法如下:
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X是特征矩阵,y是目标变量。test_size参数指定了测试集的比例,这里设置为0.2表示将数据集的20%作为测试集,80%作为训练集。random_state参数用于设置随机种子,保证每次划分结果的一致性。
阅读全文