train_test_split函数的参数有哪些?
时间: 2023-11-07 11:06:03 浏览: 69
pd_split_train_test.rar_pandas_pandas对数据分类_pd.split_split_数据分类
train_test_split函数的参数有:
- test_size:测试集的大小,可以是一个浮点数(0到1之间表示测试集所占比例)或一个整数(表示测试集的样本数量)。
- train_size:训练集的大小,可以是一个浮点数(0到1之间表示训练集所占比例)或一个整数(表示训练集的样本数量)。若未指定,将自动根据test_size计算出训练集大小。
- random_state:随机种子,用于控制划分数据集的随机过程。不同的随机种子会得到不同的划分结果。
- shuffle:是否在划分数据之前对数据进行洗牌,默认为True。
- stratify:按照原始数据中的类别比例,生成划分后的数据集。当原始数据中的类别不平衡时,可以使用stratify保持在训练集和测试集中的类别比例相同。
阅读全文