用train_test_split拆分数据,如何保证每次拆分的数据不同
时间: 2023-07-24 10:24:11 浏览: 94
在使用`train_test_split`函数时,可以通过设置`random_state`参数来保证每次拆分的数据不同。`random_state`参数是一个随机数种子,它会影响数据的随机打乱和拆分方式,因此在每次调用`train_test_split`函数时,设置不同的`random_state`值可以得到不同的数据拆分结果。
具体实现步骤如下:
1. 导入`train_test_split`函数。
2. 将数据划分为训练集和测试集。
3. 每次拆分数据时,都设置一个不同的`random_state`值,确保每次拆分的数据不同。
下面是一个示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设有100条数据和对应的标签
data = ...
target = ...
# 划分比例为70%训练集,30%测试集
train_data, test_data, train_target, test_target = train_test_split(data, target, test_size=0.3, random_state=42)
# 每次拆分数据前都设置一个不同的random_state值
train_data_1, test_data_1, train_target_1, test_target_1 = train_test_split(data, target, test_size=0.3, random_state=123)
train_data_2, test_data_2, train_target_2, test_target_2 = train_test_split(data, target, test_size=0.3, random_state=456)
```
这样,每次设置不同的`random_state`值都会得到不同的数据拆分结果,确保每次拆分的数据不同。
阅读全文