train_test_split的test_size如何使用
时间: 2023-07-20 19:19:24 浏览: 179
python中导入 train_test_split提示错误的解决
train_test_split是一种用于将数据集拆分为训练集和测试集的函数。其中,test_size参数是用于指定测试集的大小的。test_size的默认值是0.25,也就是说默认情况下测试集的大小是原始数据集的25%。
test_size可以是一个浮点数,也可以是一个整数。如果test_size是一个浮点数,则表示测试集的大小占原始数据集的比例。如果test_size是一个整数,则表示测试集的大小是具有多少个样本。
例如,如果test_size=0.3,则表示测试集的大小是原始数据集的30%。如果test_size=100,则表示测试集的大小是100个样本。
下面是一个示例,展示如何使用train_test_split函数来拆分数据集,并指定测试集的大小为20%:
``` python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
```
在这个例子中,X和y是原始数据集的特征和标签,test_size=0.2表示测试集的大小为20%。函数的返回值是拆分后的训练集和测试集的特征和标签。
阅读全文